王志勇 发表于 2021年02月02日 16:57
出现这个bug的原因是,大部分的RSS,里面都是10篇,或10多篇最新的文章。但是有的RSS,里面有超过40篇的文章,有些是历史的旧文章。经过重新解读以前的程序,一番大排查、测试,解决了这个问题。因为原来的程序,我设定的是只记录最近的30个URL,以前是完全够用的。如果超过30个URL的RSS,每次更新RSS总是会重复出现文章。于是把这个值设定为240,一般就不会出现问题了。
如果设置的值更大,500、1000,肯定不会出现重复的文章,但是它会占用数据库(文章ID列表)。
另一个bug,大概花了2个多小时。就是清空缓存之后,再更新RSS,还是会重复获取RSS,这样有点乱。修复之后,现在清空缓存之后,不会再出现以前的文章,而是清空缓存之后的文章。
也就是,现在新改的程序是,清空缓存之后,在首页更新RSS,如果没有新的文章,会一直空白,直到新的文章出现。
还有一个大的功能可能需要去实现
昨天在路上想到的,就是当第一次更新大量RSS时,首页的排列日期不是按照综合的日期,而是按照作者排列。本来是能够做成按照综合的日期,但这样需要再建立一个大的数据库,如果一组RSS的数量很多的时候,这个数据库可能会很大。所以,这个功能暂时不改了,以后需要的时候再改。
但因为现在新改的程序,清空缓存之后,以前的文章不再显示,所以影响不太大。如果每个博客近期只是更新两三篇,总的排列顺序基本也是按照综合的日期。
经过更新的Feedval阅读器
现在功能已经更完美了。前几天说到的订阅成功率的问题,我发现现在大多数的个人博客,没有开启反爬虫,所以PHP版的RSS阅读器,大部分都能订阅,这是个大好消息。
只有一些商业的博客,比如VPS推介博客,有些有开启反爬虫,有些没有开启。
Feedval阅读器的更新方法
请点击:面板→在线升级→开始升级
升级后的版本是:1.1.5
置顶的文章:
论朋友圈可以发什么?
短信验证开发的方案分享
巡回更新:2018-09-21
速度是永恒的主题
UTF-8、HTTPS原来都是浮云
https安全吗?
独立博客有必要安装https吗?
近期的主题:
创业杂谈(6):捡钱/赚钱的一个重要原理
夹缝中生存
2023新年开篇:人生最重要的事情,念经持咒
2022年结语
创业杂谈(5):赚钱方法秘密的发现
创业杂谈(4):博客怎样写有(大的)流量?
中文博客最恰当的叫法
本博客需要重温置顶
指出最不规范的网名
编程杂谈(6):永恒的论坛和2023问题
创业杂谈(3):为什么网络赚钱会这样难?
谈永恒的论坛
最难熬的2022年冬天
创业杂谈(2):寻求成功
通勤50分钟买电驴吗?
编程杂谈(5):为什么说编程就是创业?
编程杂谈(4):擅长和成功
编程杂谈(3):为什么写程序必须辞职?
编程杂谈(2):最重要的因素和资金问题
编程杂谈(1):选择项目
版权声明:本博客所有文章,均符合原创的定义,禁止转载,违者将必究;正确的方法是贴原文的标题和网址即可。
与此相关的链接
自由勇专栏
Blog存档 Archives
2022年07月
2022年06月(15)
2022年05月(20)
2022年04月(16)
2022年03月(9)
2022年02月(9)
2022年01月(10)
2021年 +