一个读取pdf的方法

function readPDFDoc(file) {

    const reader = new FileReader();

    reader.onload = function(event) {
        const pdfData = event.target.result;
        // 使用PDF.js加载和解析PDF文件
        pdfjsLib.getDocument({ data: pdfData }).promise.then(function(pdf) {
            pdf.getPage(1).then(function(page) {
                page.getTextContent().then(function(textContent) {
                    let text = "";
                    textContent.items.forEach(function(item) {
                        text += item.str + " ";
                    });
                    alert(text);
                    console.log("提取到的文本内容:", text);
                });
            });
        }).catch(function(error) {
            console.error('加载PDF时发生错误:', error);
        });
    };

    reader.readAsArrayBuffer(file);
}

需要在此处搞到以下库
https://www.cdnpkg.com/pdf.js?id=59910

<script type="text/javascript" th:src="@{/js/pdf.min.js}"></script>
<script type="text/javascript" th:src="@{/js/pdf.worker.min.js}"></script>


扫描二维码,在手机上阅读!

发表评论

电子邮件地址不会被公开。 必填项已用*标注