可以支持从ppt、pdf、epub、网页进行知识拆分吗?
这个步骤要兼容的东西比较多,你可以先将这些源转成markdown,然后再用网站拆分,我们一个一个适配要很久。
而且比如网页涵盖的东西很多,有视频图片以及各种样式,还可能遇到网站防爬虫等各种规则限制,突破这些限制要一个一个网站适配,还要跟着目标站一起维护,我们以目前的人手,做不到这样。