オランダのセキュリティベンダーCodean Labsは5月20日(現地時間)、「PDF.js」に任意のJavaScriptコードを実行できる脆弱性(CVE-2024-4367)があることを明らかにした。 「PDF.js」は、HTML5で構築されたPDFビューワー。「Firefox 19」以降に搭載されている内蔵PDF ...
PDFは安全な文書フォーマットだと思われがちです。 しかし実際には、PDFはコードを実行できるコンテナです。 つまり、PDFは“ただの文書”ではありません。 実行可能な攻撃ベクターです。 PDFに埋め込まれるJavaScript PDFではJavaScriptを埋め込むことが可能です。
PDFからのテキスト抽出はRAGフローやAgentの構築をはじめとして多くのケースで必要になる作業です。最近はDeepSeek-OCRなどOCRパフォーマンスの良いLLMが出ていたり、そもそも一般のLLMに画像を入力することも可能なので、PDFテキストを画像としてLLMに渡して ...
PDF.js is a Portable Document Format (PDF) viewer that is built with HTML5. PDF.js is community-driven and supported by Mozilla. Our goal is to create a general ...