开启爬取任务: 你可以在此指定网页爬取起始点的网址和开启爬取。 "爬取中"意即YaCy会下载指定的网站, 并提取出其中的链接,接着下载链接中的全部内容。 它将一直重复上述步骤,直到满足指定的"爬取深度"。 A crawl can also be started using wget and the post arguments for this web page.
爬取任务由一个或多个起始点、爬取限制和文档更新规则构成。
这些是爬取堆栈器的限制。这些过滤器将在网页加载前被应用。
这些是对索引供给器的限制。加载网页后过滤器才会被应用。
这些是文档部分的限制.加载网页后将应用过滤器. You can choose to: