“ | 历史原型什么的最讨厌啦! | ” |
基本资料 | |
编辑页面数 | 5,029个页面! |
---|---|
编辑次数 | 6,263次编辑! |
战斗力 | 5,099分! |
C8H17OH-bot是C8H17OH基于Pywikibot开发的机器人。
检查消歧义页的链入,对易于清理的进行清理,即将页面中指向消歧义页的链接改为正确的条目。程序算法大致如下:
其中前缀、后缀的含义参见萌娘百科:条目命名#重名处理原则。
理想状态下,“关键词”为
本程序易于清理的情况包括:
其他情况则难以处理。
由于上述判断带有一定的不准确性,以及操作者个人知识和精力对人工复查准确度的影响,程序有可能出现错误的链接更改。对于部分已知的可能出错的页面,会列入单独的跳过列表,在程序运行时予以跳过。
程序会定期(初步定为每月)我想起来的时候检查站内所有消歧义页,并在人工监督下清理;此外,在特定情况下,例如将某个条目移动至带前缀或后缀的名称并将原名页面改为消歧义页后,也会处理单个消歧义页。
这两个系列有个共同点:
上述现象导致本机器人会检查出许多指向此类消歧义页的链接,尤其是会发现大量拆分完成后的历史遗留。
这一现象一度使我苦恼是否要执行此类消歧义,尤其是在我对这两个系列都不甚了解的前提下,有时难以判断某处提及到底是指其中一部作品的该角色还是指整个系列的该角色。目前我所采取的原则是Yes。
如果有关于此事的任何意见建议,欢迎联系我讨论。
清理站内指向bilibili的链接中的“spm_id_from”无用GET参数(或称URL参数、查询参数),包括:
参数名 | 二级域名 | 备注 |
---|---|---|
from | www manga mall …… |
|
seid | (忘了) | |
spm_id_from | www | 似乎与网页端点击链接有关 |
vd_source | ||
from_spmid | (忘了) | |
referfrom | manga | |
bilifrom | www vc t space |
似乎与分享链接有关? |
share_source | ||
share_medium | ||
share_plat | ||
share_session_id | ||
share_tag | ||
share_times | ||
timestamp | ||
bbid | ||
ts | ||
from_source | search | |
broadcast_type | live | |
is_room_feed | live |
这些参数仅供网站分析用户的行为路径,其值对页面本身无影响,故无需(甚至说不应该)保留在本站存放的此类链接中。
本程序遍历主(或其他)名字空间的所有页面,遍历页面上的所有外部链接,如果发现B站链接中的无用参数,则在原文中去除它们,经操作者确认后提交。
根据操作者或其他用户(通过萌娘百科_talk:讨论版/操作申请或其他渠道)提出的批量操作需求,编写代码进行批量操作。
目前已经有编写好的代码、可以快速进行的操作包括:
如有其他需求可以联系我,如果有时间且感觉可行的话我会尝试编写。