WP Content Crawler-自动爬取采集任意网站的任意内容[更至v1.15.0]

WP Content Crawler-自动爬取采集任意网站的任意内容[更至v1.15.0]图片

WP Content Crawler v1.15.0 最新中文汉化版插件下载 一年免费更新 (v1.15.0要求至少使用 PHP 8.1)

功能十分强大的 WordPress 专业版内容采集插件,支持多种翻译接口,支持自动翻译,支持OpenAI GPT (ChatGPT)!

注意:虽然该采集插件带设置向导支持可视化选择,但凡是内容采集类插件就都有一定技术门槛,最好是懂一些CSS选择器基础知识,有时可能会需要自己手动设置采集方案,因此不建议新手小白购买哦!

另外:该插件无法检索使用 JavaScript 创建的内容。有关详细信息,请参阅我可以从 X 站点获取内容吗?

汉化效果截图

WP Content Crawler-自动爬取采集任意网站的任意内容[更至v1.15.0]图片1

该插件无法使用常规方式进行汉化,本站已解决此问题,汉化率100%,强迫症手动精校正。

WP Content Crawler-自动爬取采集任意网站的任意内容[更至v1.15.0]图片2

插件用途

  • 创建一个个人网站,从您喜爱的网站收集新闻、帖子等,以便在一个地方查看它们
  • 将其与 WooCommerce 结合使用从购物网站收集产品
  • 从联属计划收集产品来赚钱
  • 收集帖子为您的插件/主题创建测试环境
  • 从其他网站收集插件、主题、应用程序、图像以创建它们的集合
  • 跟踪竞争对手
  • 你可以想象任何事情。互联网充满了内容:)
WP Content Crawler-自动爬取采集任意网站的任意内容[更至v1.15.0]图片4

主要特点

保存每个帖子的详细信息
标题、摘录、内容、标签、类别、slug、日期、自定义元、分类法、元关键字、元描述、特色图像、帖子图像、状态……一切。
视觉检查器
只需单击一个元素即可找到其 CSS 选择器。您还可以获得您可能感兴趣的替代 CSS 选择器。无需再离开管理面板。
抓取(抓取、抓取、保存)帖子
配置设置后,插件会查找帖子的 URL 并在后台自动抓取它们。

重新抓取(更新)帖子
自动重新抓取帖子以使其始终保持更新。您可以限制帖子的更新次数、设置更新间隔并忽略旧帖子。
删除帖子
您想删除旧的已爬网帖子吗?该插件可以自动删除它们。




控制计划
您可以设置每次为站点运行 URL 收集和帖子爬网事件的次数。例如,您可以每分钟保存 3 个帖子,或每 2 分钟运行 URL 收集 5 次。

保存类别
您的网站中不存在目标类别?没问题。该插件可以为您创建目标类别。只需定义查找类别名称的 CSS 选择器即可。它们甚至可以创建为子类别。
保存链接(永久链接)
您可以定义帖子的永久链接。您可以从目标站点获取永久链接,输入自定义文本,甚至使用短代码为 slugs 创建模板。
保存分类
通过从目标站点检索或手动输入来保存分类值。保存自定义帖子类型的详细信息比以往更容易。



将帖子保存到自定义类别
自定义帖子类型是否具有自定义类别?没问题。您可以定义自定义帖子类型使用的自定义类别分类法,并在定义帖子类别时选择这些类别。该插件还可以为您创建自定义类别。
自定义帖子元
将任何内容保存为自定义帖子元。您可以使用 CSS 选择器或仅键入值。


内容模板
使用短代码准备帖子内容、标题、摘录、列表项和图库项模板。此外,您可以使用选项框为每个 CSS 选择器的值定义模板。
替代选择器
即使目标站点的帖子页面设计彼此不同,您也可以编写替代选择器来获取数据。




查找和替换任何内容
您可以使用纯文本或正则表达式来查找和替换任何内容。您甚至可以修改页面的 HTML、创建自己的 HTML 元素并编写选择器来使用它们。您甚至可以更改图像 URL。你有权力。
分页帖子
目标帖子有多于一页?不用担心。您也可以保存分页帖子。

列表类型帖子
有些网站创建的帖子中包含列表。您可以从帖子中提取列表,创建应应用于每个列表项的模板,甚至反转列表。

删除不必要的元素
有时您需要删除一些元素,例如广告、评论等等。只需编写其 CSS 选择器即可将其删除。

自动插入类别 URL
目标站点有数百个类别?小菜一碟。只需编写 CSS 选择器,插件就会为您插入它们。

帖子类型
设置帖子类型。它可以是帖子、页面、产品或 WordPress 安装中可用的任何其他帖子类型。

删除链接
您可以从帖子中删除链接。只需选中复选框,链接就会消失。就这么简单。
密码保护
您可以为帖子设置密码,仅向拥有密码的用户显示。
注释
您可以为自己添加注释,以提醒您有关该网站的信息。CSS 选择器、TODO 列表等等。


动态测试所有内容动态
测试帖子爬行、URL 收集、CSS 选择器、正则表达式、查找和替换选项以及代理。您还可以启用缓存以更快地执行测试并减少发送到目标站点的请求。
一次测试站点的所有设置
使用测试器,您可以测试在站点设置中配置的所有选项,以确保在启用自动爬网之前一切都按您想要的方式工作。
工具
使用这些工具,您可以手动保存帖子及其 URL、使用其 ID 重新抓取帖子或删除已保存的 URL。
每个站点的自定义常规设置
您可以为每个帖子提供自定义常规设置以覆盖它们并使它们适合站点。
帖子状态
您可以直接发布已保存的帖子或将其保留为草稿以便在发布前进行检查。
保存帖子内容中的所有图像
保存帖子内容中的所有图像就像选中单个复选框一样简单。



将图像另存为图库
您可以将目标页面中的图像另存为图库,并为每个图像提供一个模板,以使其适合您在前端使用的图库库。您还可以通过选中一个复选框将图像保存为 WooCommerce 图库。
任何数据作为短代码
从目标页面获取任何内容作为短代码,并使用插件模板中的短代码将任何数据放置在您想要的任何位置。
代理
使用一个或多个代理从您的 IP 无法访问的站点获取内容。

Cookie
将 cookie(例如会话 cookie)附加到每个请求。例如,通过这种方式,您可以像登录一样抓取目标站点。
抓取任意数量的帖子
您可以设置帖子抓取或 URL 收集 CRON 事件应运行的次数。通过这种方式,您可以每分钟保存 100 个帖子。请小心并考虑服务器的容量。
电子邮件通知
设置 CSS 选择器,其值对于类别和帖子页面不应为空。当使用这些选择器发现空值时,您可以收到电子邮件通知。
从 JSON 获取数据
当您为 CSS 选择器启用 JSON 解析时,您可以轻松地从 JSON 获取值。


高级 HTML 操作
在响应 HTML 中查找替换、在元素属性中查找和替换、交换元素属性、删除元素属性、操作元素的 HTML、删除 HTML 元素…


自动翻译
使用 DeepL Translate API、Google Cloud Translation API、Microsoft Translator Text API、Yandex Translate API 或 Amazon Translate API 的人工智能自动翻译帖子。请注意,这些都是付费服务。他们通常在有限的时间内免费提供该服务。您可以查看他们的定价页面以了解更多信息。
自动旋转
使用旋转自动重写已爬网帖子的内容,以改进搜索引擎优化。该插件目前实现了 Spin Rewriter API 和 Turkce Spin API,这些都是付费服务。您可以访问他们的网站以了解定价详细信息。


重复帖子检查
按 URL、帖子标题和/或帖子内容检查重复帖子。如果您使用的是 WooCommerce,其 SKU 已存在的产品将被视为重复,并且不会添加到您的网站。
预定帖子
您可以在发布日期中添加/删除分钟数。通过这种方式,您可以安排帖子发布。

保存 WooCommerce 产品
保存价格、库存、运输、属性和高级选项。您可以将产品另存为简单产品或外部产品。您还可以设置可下载文件选项并将产品定义为虚拟产品。这些选项适用于大于或等于 3.3 的 WooCommerce 版本。
选项框
您拥有控制权!为 CSS 选择器找到的值定义许多选项。这些选项包括查找替换、计算、模板和 JSON 解析设置。您还可以轻松导入/导出选项框中定义的选项。
像专业人士一样处理文件
轻松重命名、复制和移动已保存的文件。您还可以使用可在其中使用任何短代码的模板来定义已保存媒体文件的标题、说明、标题和替代文本。还可以为保存的文件指定随机名称。

像专业版一样处理 iframe 和脚本
WordPress 不允许显示 iframe 和脚本,因为它们会带来安全风险。您只需选中复选框即可将 iframe 和脚本 HTML 元素转换为短代码。短代码将显示来自您定义的允许源域的 iframe 和脚本。
快速保存
使用快速保存按钮,您可以更快地保存设置。无需等待页面重新加载。

正则表达式
在查找-替换选项中定义正则表达式以查找-替换任何内容。您还可以使用分隔符和修饰符来更精确地匹配。

保存“srcset”属性
当保存的图像的替代尺寸可用时,插件会将它们分配到 img 元素的 srcset 属性中,以便您的页面在不同的屏幕尺寸下加载速度更快。


保存“alt”和“title”属性
保存图像时,会自动从目标站点检索其“alt”和“title”属性并将其分配给保存的媒体。您还可以为他们定义模板来应用您的 SEO 策略。
警告
出现问题时了解。该插件将向您显示错误的详细信息,以便您可以立即修复它。


处理字符编码问题
该插件能够处理不同的字符编码,即使目标站点包含混合编码。您可以通过选中单个复选框来转换编码。
轻松在设置之间导航
将导航固定到顶部!该插件会存储您在切换到新选项卡之前所在的位置,并在您再次激活该选项卡时恢复您之前的位置。不再迷失在各种设置中。

手动抓取工具
使用手动抓取工具,通过输入 URL 来保存多个帖子。您还可以输入类别 URL,以便该工具可以从那里获取帖子 URL。此外,您可以将其设置为同时抓取多个帖子。




将 URL 添加到数据库
该插件会自动收集 URL。但是,如果您希望它只抓取某些 URL,您可以使用手动抓取工具将它们手动添加到数据库中。通过这种方式,将使用您的计划选项自动抓取指定的 URL。
启用/禁用特定站点的自动爬网
您可以单独启用或禁用每个站点的自动爬网。

导入/导出
您可以轻松导入和导出站点设置。只需复制并粘贴插件创建的代码即可。
无限
将无限的站点添加到插件并激活您想要的数量。


详细的仪表板
查看后台发生的情况。活跃站点、爬行的帖子数量、更新的帖子数量、上次爬行和更新的帖子、上次添加的 URL、上次和下次运行的 CRON 事件、当前保存的帖子和 URL…
从管理面板获取更新
每当更新准备就绪时,您只需单击一下即可更新插件。只需转到管理面板中的更新页面即可。
使用最安全的PHP
该插件支持最新版本的PHP。
使用最现代的浏览器
该插件支持 Chrome、Firefox、Safari、Opera 和 Edge。
交互式指南
交互式指南向您展示如何逐步配置设置以实现某些目标,就像实时文档一样。您可以随时启动这些指南。您甚至可以从特定步骤开始。
在线文档
您可以随时查看在线文档。

设置旁边的快速指南
插件中的每个设置都有一个快速指南,可帮助您了解每个设置的用途。
视频教程
观看视频教程以轻松学习如何使用该插件。
准备翻译
您可以使用 Poedit 将插件翻译成您自己的语言。



过滤器
使用过滤器,您可以有条件地执行操作。例如,如果产品的属性值之一包含特定单词,您可以提高产品的价格。过滤器包含许多操作命令。请参阅 文档中的 命令。
使用 OpenAI GPT (ChatGPT)
您可以使用 OpenAI GPT 模型更改标题、内容、标签、文件名等。您可以使用 GPT-3.5 和 GPT-4。通过高级短代码生成器,您可以使用聊天、完成、编辑和插入模式。要了解更多信息,请观看此视频
要求PHP >= 7.3、json、mbstring、curl、dom、fileinfo、WP-Cron。这些已经在大多数主机中可用。即使扩展尚未激活,大多数托管站点也允许您从其控制面板启用这些扩展。请参阅文档以获取更多信息。
语言英语、土耳其
资源下载
插件下载此资源下载价格为250金币(包年VIP免费)升级包年VIP立即购买(购买后365天内可下载)
汉化文件(不含插件)此资源下载价格为490金币(VIP 8折、终身VIP免费)升级VIP立即购买(购买后365天内可下载)
>>>新站成立,VIP促销优惠中,后面会随网站资源数量增加而不定时涨价,欲购从速哦!<<<
0 0 投票数
文章评分
订阅评论
提醒
0 评论
最旧
最新 最多投票
内联反馈
查看所有评论
购物车
  • 您还没有选择任何商品哦。
滚动至顶部