FictionDown

FictionDown是一款网文爬取专用工具,支持全自动校对、多格式转化,处理章节目录缺少和章节目录次序紊乱的难题,内嵌了简易的广告过滤,事实上绝大多数必须手动式删掉!

软件亮点

  以起点为样版,多网站线程同步爬取校对

  支持导出来txt,以兼容大部分阅读软件

  支持导出来markdown,可以用pandoc转化成epub,保存书籍信息、卷构造、创作者信息

  内嵌简易的广告过滤(如今还不健全)

  用Golang撰写,安裝布署便捷,外界依靠仅有PhantomJS

使用方法

  键入起点连接

  获得到书籍信息,刚开始爬取各章內容,碰到vip章节目录放进Example中做为校对样版

  手动式设定笔趣阁等盗用小说集的相匹配连接,tamp字段名

  再度起动,刚开始爬取,只爬取VIP一部分,并跟Example开展校对

  手动式编写相匹配的缓存,手动式删掉广告宣传和一些任意标识符(有一部分是关键词,很有可能会造成 pandoc内存溢出或是款式不正确)

  d -f md形成markwown

  用pandoc转化成epub,pandoc -o xxxx.epub xxxx.md

软件功能

  未完成作用

  爬取起点的情况下携带Cookie,用以爬取已选购章节目录

  支持刺猬猫(即“欢乐书客”)

  支持立即輸出epub,不用pandoc

  支持小说集站内关键字搜索

  线程同步变换md

  梳理main库中的鲜面条逻辑性

  梳理命令行参数设计风格

  在windows下,md变换到epub时有途径难题

  健全广告过滤

  简单化应用流程

  提升log輸出

  书籍介绍也应当为HTML。即lt;pgt;??lt;/pgt;而不是如今的用\t和\n

【版本更新】

  小说集站内关键字搜索

  cmd梳理

  改动网站搭配构造

  每个輸出文件格式稍作梳理

FictionDown

本文来自互联网或AI生成,不代表系统内阁立场。本站不负任何法律责任。

如若转载请注明出处:https://www.system.cab/baike/203032.html

热心网友的头像热心网友
上一篇 2025-05-15 17:14
下一篇 2025-05-15 17:15

相关推荐

无论是个人用户还是专业人士,都能在这里找到适合自己的系统版本。
本站[系统内阁]所有内容来自互联网投稿或AI智能生成,并不代表[系统内阁]的立场。