[GH-ISSUE #359] [feat] 文件记录支持更多的格式,例如 pdf,xlsx,word #261

Closed
opened 2026-03-02 03:38:48 +03:00 by kerem · 7 comments
Owner

Originally created by @semifly on GitHub (Jul 8, 2025).
Original GitHub issue: https://github.com/codexu/note-gen/issues/359

Originally assigned to: @codexu on GitHub.

记录的文件功能增加常用的文件格式,例如:pdf,xlsx,word等

Originally created by @semifly on GitHub (Jul 8, 2025). Original GitHub issue: https://github.com/codexu/note-gen/issues/359 Originally assigned to: @codexu on GitHub. 记录的文件功能增加常用的文件格式,例如:pdf,xlsx,word等
kerem 2026-03-02 03:38:48 +03:00
  • closed this issue
  • added the
    feature
    label
Author
Owner

@codexu commented on GitHub (Jul 9, 2025):

可能会优先支持 pdf,这个功能将在完善 pdf 导出功能时同时开发。

<!-- gh-comment-id:3050704021 --> @codexu commented on GitHub (Jul 9, 2025): 可能会优先支持 pdf,这个功能将在完善 pdf 导出功能时同时开发。
Author
Owner

@code2tan commented on GitHub (Jul 10, 2025):

可能会优先支持 pdf,这个功能将在完善 pdf 导出功能时同时开发。

不要支持word、xlsx,纯种markdown就挺好

<!-- gh-comment-id:3055368632 --> @code2tan commented on GitHub (Jul 10, 2025): > 可能会优先支持 pdf,这个功能将在完善 pdf 导出功能时同时开发。 不要支持word、xlsx,纯种markdown就挺好
Author
Owner

@semifly commented on GitHub (Jul 10, 2025):

@code2tan 我也很喜欢纯粹的markdown,如您说所,只支持markdown,没什么毛病。但是在实际的使用过程中难免不会遇到其他的文件,记录的时候还得先转成markdown再记录,显得很麻烦。

<!-- gh-comment-id:3056084903 --> @semifly commented on GitHub (Jul 10, 2025): @code2tan 我也很喜欢纯粹的markdown,如您说所,只支持markdown,没什么毛病。但是在实际的使用过程中难免不会遇到其他的文件,记录的时候还得先转成markdown再记录,显得很麻烦。
Author
Owner

@codexu commented on GitHub (Jul 10, 2025):

word、xlsx 读取可能会使安装包体积增大很多,可能暂时不考虑。

<!-- gh-comment-id:3056349348 --> @codexu commented on GitHub (Jul 10, 2025): word、xlsx 读取可能会使安装包体积增大很多,可能暂时不考虑。
Author
Owner

@codexu commented on GitHub (Jul 10, 2025):

#371 提到读取代码,因为代码文件都以纯文本读取,所以可做支持。

<!-- gh-comment-id:3056351766 --> @codexu commented on GitHub (Jul 10, 2025): [#371](https://github.com/codexu/note-gen/issues/371) 提到读取代码,因为代码文件都以纯文本读取,所以可做支持。
Author
Owner

@codexu commented on GitHub (Jul 16, 2025):

关于导出 PDF 和导入 PDF 功能,经过调研,实现它会使安装包体积增加 3 MB 左右,所以此功能暂时取消开发。
这里推荐一下使用 MarkItDown 将 PDF、word、excel 这类文件转化为 markdown 后再导入 NoteGen,专业的事情交给专业工具。

<!-- gh-comment-id:3076918451 --> @codexu commented on GitHub (Jul 16, 2025): 关于导出 PDF 和导入 PDF 功能,经过调研,实现它会使安装包体积增加 3 MB 左右,所以此功能暂时取消开发。 这里推荐一下使用 [MarkItDown](https://github.com/microsoft/markitdown) 将 PDF、word、excel 这类文件转化为 markdown 后再导入 NoteGen,专业的事情交给专业工具。
Author
Owner

@TeliangWang commented on GitHub (Aug 1, 2025):

关于导出 PDF 和导入 PDF 功能,经过调研,实现它会使安装包体积增加 3 MB 左右,所以此功能暂时取消开发。 这里推荐一下使用 MarkItDown 将 PDF、word、excel 这类文件转化为 markdown 后再导入 NoteGen,专业的事情交给专业工具。

我之前pull的导出PDF功能调用浏览器打印 API,加上CSS样式设计几百行代码就可实现,不需要新增依赖
导入PDF的话用DS这些大模型工具就可以很好地转为MD

<!-- gh-comment-id:3143776629 --> @TeliangWang commented on GitHub (Aug 1, 2025): > 关于导出 PDF 和导入 PDF 功能,经过调研,实现它会使安装包体积增加 3 MB 左右,所以此功能暂时取消开发。 这里推荐一下使用 [MarkItDown](https://github.com/microsoft/markitdown) 将 PDF、word、excel 这类文件转化为 markdown 后再导入 NoteGen,专业的事情交给专业工具。 我之前pull的导出PDF功能调用浏览器打印 API,加上CSS样式设计几百行代码就可实现,不需要新增依赖 导入PDF的话用DS这些大模型工具就可以很好地转为MD
Sign in to join this conversation.
No milestone
No project
No assignees
1 participant
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference
starred/note-gen#261
No description provided.