您现在的位置是:首页 > 软件下载 > 网络工具 > 上网辅助 >

XPath2Doc 1.0.0.1正式版 网站数据采集工具

XPath2Doc 1.0.0.1正式版 网站数据采集工具

XPath2Doc 1.0.0.1正式版 网站数据采集工具

宝哥软件园为您提供XPath2Doc免费下载,XPath2Doc是一个半自动收集网页生成Word docx文件的工具,具有企业搜索,天眼搜索配置,使用XPath2Doc手动登录WebBrowser窗口,找到所需的数据页面,然后单击程序按钮收集,因此它是半自动的网页数据填充了Docx工具。

软件大小:14.8MB

软件类型:国外软件

软件语言:简体中文

软件授权:共享软件

最后更新:2021-08-28 04:00:09

推荐指数

运行环境:Win7/Win8/Win10/WinALL

查看次数

XPath2Doc是一个专业的网站数据收集工具。如何收集网站数据?有一个最简单的方法,那就是通过XPath2Doc收集!这是一个通过半自动收集网页来生成Word docx文件的工具。它具有企业搜索和天眼搜索的配置。它使用XPath2Doc手动登录WebBrowser窗口,找到需要的数据页面,然后点击程序按钮进行采集。因此,它是一个用Docx工具填充的半自动网页数据。

配置说明:

1、这个程序需要三个配置文件:General.ini、custom。最后两个文件名是自己定义的。

将军。ini文件定义了存储INI文件和Docx模板文件的目录。你可以留空。默认值是程序所在的目录。

用户定义的。ini和用户定义的模板。Docx是软件用户用来创建XPath语句并最终生成文件的docx模板。有关详细信息,请参见ini文件中的说明。请注意,Docx模板文件中的“@ # 0001 # @”等字符是INI文件中定义的标记字符串,用于替换网页集的内容。替换关键字的后缀和模板文件名在ini文件中定义。

2.在使用这个程序之前,请创建您自己的INI配置文件和Docx模板文件。(详情请参考随附的公司文件、2D配置文件和起诉模板)

需要注意的是,模板文件支持待采集文档不同部分的不同URL,所以要注意URL的设置。

XPath2Doc

工作准则:

网页的每一个元素都可以表示为一个XPath语句,所以我们可以读取浏览器打开的网页的源代码,通过XPath语句获取网页元素中的文本。

如何获取XPath语句:

通常我们可以用谷歌Chrome浏览器打开网站页面,按F12打开开发者工具界面。在ELements选项卡下,当鼠标移动时,可以看到Web内容被阴影覆盖。单击三角形符号可以更进一步。找到准确的位置,直到找到所需的最终数据位置。右键单击找到的文本,从弹出菜单中选择复制-复制XPath,并将其粘贴到记事本中以获得所需的XPath语句。

这里需要说明的是,如果复制的XPath语句中的/Tbody会影响集合,那么问题将由程序内部处理,但在某些特殊情况下可能会影响数据的收集,可以手动删除。

软件说明:

启动程序-选择模板-单击“捕获数据”按钮旁边的黑色三角形,单击下拉菜单,然后单击要捕获的零件。等待浏览器加载网页,手动输入需要查询的内容,点击查询,找到数据的具体页面,然后点击“收集数据”按钮,查看列表右侧是否有需要的数据。继续打开下拉菜单,选择下一个要收集的部分。如果网址发生变化,请等待浏览器加载并找到所需的数据页面。单击收集数据按钮,查看数据的第二部分是否在右侧列表中获得。重复此过程,直到数据完全收集完毕。

如果两部分的网址相同,则需要在浏览器中重新查询新数据,然后再点击下一部分的下拉菜单。当新数据页面出现时,单击下拉菜单选择下一个要收集的零件。(如果网址相同,点击下一步直接从网页获取数据。如果浏览器不改变页面,数据就是错误的。)如果需要重新获取零件,请在下拉菜单中单击零件的名称,然后单击“Capture”按钮重复采集(此时可以更改浏览器的数据页面,从不同的公司获取数据)。

如果列表中收集的数据有偏差,可以点击自行修改。如果XPath语句有错误,可以自己修改测试结果(XPath语句修改后会立即重新捕获浏览器数据,所以浏览器应该是一个有效的数据页面)。修改后的XPath语句程序不会保存到INI文件,请自行保存。

如果列表中的数据是正确的,并且预览窗口中Docx模板的内容是正确的,您可以单击“创建文档”按钮来填写要生成的文件的名称。软件将使用捕获的网页数据替换模板中的索引字符串,并自动生成它。Docx文档。

需要注意的是,右下角的Docx预览窗口不能完全支持Word文档。对于非标准文档,文本可能会丢失或放错位置。在这种情况下,您可以忽略它或将模板文件更改为规范的文本格式(单行间距)。

XPath2Doc 1.0.0.1正式版 网站数据采集工具下载地址

XPath2Doc 1.0.0.1正式版 网站数据采集工具:
暂不提供下载

相关教程

猜你喜欢