解析PDF

  • 一款使用AI来解析PDF的开源工具:gptpdf

    1、使用 PyMuPDF 库,对 PDF 进行解析出所有非文本区域,并做好标记 2、使用视觉大语言模型(如 GPT-4o)将 PDF 解析为 markdown。 我们的方法非常简单(只有293行代码),但几乎可以完美地解析排版、数学公式、表格、图片、图表等。 每页平均价格:0.013 美元 项目地址: https://github.com/CosmosShadow/gptpdf

    2024年7月3日