如何发布与订阅RSS
0.缘起
很早前就知道RSS,但是那时候很多工具不完善,操作起来非常麻烦,就没认真整理过。加上后来越来越人会去更新博客,在微博,豆瓣等社交网站上会更新得更快,就更没有动力去弄。直到今天到了一篇好的文章,想收藏,才又重新生起了这个念头,找了一下,发现现在已经有了很多工具去自动更新了,所以就整理了一下,记录下步骤。
1.何为RSS
RSS(简易信息聚合)是一种消息来源格式规范,用以聚合经常发布更新数据的网站,例如博客文章、新闻、音频或视频的网摘。RSS文件(或称做摘要、网络摘要、或频更新,提供到频道)包含全文或是节录的文字,再加上发布者所订阅之网摘数据和授权的元数据。把新闻标题、摘要(Feed)、内容按照用户的要求,“送”到用户的桌面就是RSS的目的。 RSS摘要可以借由RSS阅读器、feed reader或是aggregator等网页或以桌面为架构的软件来阅读。标准的XML档式可允许信息在一次发布后透过不同的程序阅览。用户借由将网摘输入RSS阅读器或是用鼠标点取浏览器上指向订阅程序的RSS小图标之URI(非通常称为URL)来订阅网摘。RSS阅读器定期检阅是否有更新,然后下载给监看用户界面。
2.订阅RSS
市面上RSS的阅读器还挺多的,但都大同小异吧。我个人用的是feedly,因为feedly的网页版看着还挺舒服的,而且我用来阅读的软件是unread,上面支持的登录方式就有feedly。feedly支持Google账户登录,所以基本上不需要做过多的操作。打开 https://feedly.com 登录后点击左下角的add content 就会弹出搜索框,你只要输入你要订阅的博客的网站,基本上都能搜到对应的RSS源。例如 你输入 http://www.ruanyifeng.com/blog/ ,会自动弹出 阮一峰 的博客的源。至于怎么弄到的我就没细究,可能是feedly自动去爬的吧。 而且更牛逼的是,上面会显示多少人订阅了这个blog,而且同时会给你推荐类似的博主RSS,这个让我有点惊喜,已经跟社交软件差不多了。
3.RSS阅读工具
阅读工具我用的是unread,也不知道在哪看到的安利文所以下的,据说是最极简的客户端,右手一只拇指就能走天下。另一个原因是app store 的 feedly客户端 在中国这边没法下载。
4.制作源
订阅源比较简单,源地址给你了,你加上去就可以了。不过制作源就比较麻烦了。 这里我简单说下原理和流程,具体操作你们根据我说的去搜对应的操作就行了。 源的本质就是一个固定格式的xml文件,客户端拿到你这个xml,在客户端进行渲染就是你看到的图文并茂了。 所以制作源的本质就是你提供一个固定地方来放置xml,供客户端抓取。 那我们平时写blog已经很忙了,如果还要维护一份xml的副本,那不就很麻烦了吗? 有没有什么东西能否每次我们写完博客后,替我们保存一个xml,并且自动将我们写的内容更新到xml里面呢? 答案是有的。我这里用的是feed43.com。这个会根据你输入的blog地址,然后你自己写个正则去匹配对应的内容。 它们的正则也很小白,就两个关键字{ % }和{*}, 然后生成一个xml。免费版本应该是6小时抓一次吧。 具体操作步骤我就不赘述了。 可以参考https://sspai.com/post/34320 和 https://wzfou.com/rss-any/ 这两篇文章,都写得很好,图文并茂。 xml生成之后,你在feedly中输入后,就能看到博客的内容了。 不过这里有个问题,因为你是通过正则抓取的内容,所以你输入的如果是博客的首页,首页可能只展示文章的简介。如果你想抓取文章的全文,那么就需要用到全文订阅的网站了。
5.全文订阅
全文订阅,就是根据你提供的xml,再去爬你的文章内容,我理解就多了一层抓取。我这里用的是 https://www.freefullrss.com/, 你把在上一个步骤里生成的xml 放到这里。点击生成就行了。它会根据你输入的xml,再爬一次,然后再生成一个xml。你拿着这个新生成的xml去feedly add content一下,你就会发现又有一个昵称一样的源,不过这次的源显示的就不止是简介了,点进去后会是全文内容。 至此,基本上整个流程就结束了,你可以开始愉快的阅读了。
6.后记
现代社会,信息爆炸。各种新闻软件,社交软件都拼了命往你脑子里塞东西。但是人的脑子就一个,能关注的事情也就几个,关注的事情多了,脑子就乱了,做事也会变得不专注了。 所以对于信息的过滤,一种是关注专业公众号,好处是信息专业,但缺点是信息单一。另外一种是头条类的聚合软件,好处是信息丰富,但缺点就是算法会越来越推送你关注领域的知识。所以,就我自己而言,目前的方式,是通过人来过滤。我喜欢关注那些我认可的人,他们发的信息都是他们对各方面信息过滤后的比较有价值信息,既保证了信息质量内容又不会单一,这是我目前觉得最好的过滤方式。