新闻

Dropbox在pdf文档和图像中结合了文本搜索

目录:

Anonim

Dropbox在短短两个月内第二次改进了其搜索系统 ,使其现在能够搜索PDF文档甚至图像文件(例如PNG或JPG)中的文本。

Dropbox:在需要的地方找到想要的东西

似乎这是Dropbox的前提,Dropbox是近几个月来一直致力于改善其搜索系统的流行云存储平台。 上个月,该公司推出了一种新 的基于机器学习的 搜索引擎 ,现在宣布正在改善光学字符识别(OCR)功能,该功能允许用户搜索PDF和图像文件中的文本

“图像格式(例如JPEG,PNG或GIF)通常无法索引,因为它们没有文本内容,而基于文本的文档格式(例如TXT,DOCX或HTML)通常可以索引。 PDF文件位于中间,因为它们可以包含文本和图像内容的混合。 图像的自动文本识别能够智能地区分所有这些文档,以对图像包含的数据进行分类。

尽管有好消息,但目前,这一新改进在两个方面受到限制。 一方面,它似乎仅限于英语

因此,现在,当用户执行出现在这些文件之一中的英语文本搜索时 ,它将显示在搜索结果中。

另一方面,正如 乔恩·波特 ( Jon Porter) 在The Verge中 收集的 那样, 该功能仅限于最昂贵的订阅级别

Dropbox Business Advanced和Enterprise用户现在可以使用该新功能,并且在接下来的几个月中,专业的Dropbox订户应可以使用该新功能。

该操作类似于去年在Dropbox移动应用程序中已经实现的技术:使用该应用程序拍摄文档,但同时运行OCR以提取文本 。 但是,这仅适用于文档的一小部分。

通过直接在搜索引擎中实现OCR功能,Dropbox现在可以在所有PDF文件和图像中搜索文本, 而不管它们是如何扫描或照相的

DropboxThe Verge字体

新闻

编辑的选择

Back to top button