收集文档处理(pdf,doc,图片。html,markdown,json,xml)相互转化,文档内容提取等AI工具
文档导出工具类,能将markdown格式的内容,转为office word,PDF,HTML等等格式的文档。不使用markdown格式的内容,直接调用MD2File的api,生成word,pdf等文档也是可以的。 另外,还可以将MD2File作为markdown转HTML的工具类。
Marker快速准确地将文档转换为markdown、JSON、chunk和HTML。支持的文档格式:PDF, image, PPTX, DOCX, XLSX, HTML, EPUB