<output id="ilehw"><bdo id="ilehw"><nobr id="ilehw"></nobr></bdo></output>
        <dl id="ilehw"><font id="ilehw"></font></dl>
          1. 声明式 Web 爬虫系统 Ferret

            MIT
            Google Go
            跨平台
            2018-10-10
            王练

            Ferret 是一个声明式的 Web 爬虫系统,旨在简化网络?#31995;?#25968;据提取,以用于 UI 测试、机器学习和分析等?#21462;?/p>

            Ferret 拥有自己的声明式语言,通过抽象出技术细节和底层技术的复?#26377;裕?#20174;而更专注于数据本身。

            特性

            • 声明式语言

            • 支持静态和动态 web 页面

            • 嵌入式

            • 可扩展

            示例

            LET google = DOCUMENT("https://www.google.com/", true)
            
            INPUT(google, 'input[name="q"]', "ferret", 25)
            CLICK(google, 'input[name="btnK"]')
            
            WAIT_NAVIGATION(google)
            
            FOR result IN ELEMENTS(google, '.g')
                // filter out extra elements like videos and 'People also ask'
                FILTER TRIM(result.attributes.class) == 'g'
                RETURN {
                    title: INNER_TEXT(result, 'h3'),
                    description: INNER_TEXT(result, '.st'),
                    url: INNER_TEXT(result, 'cite')
                }
            的码云指数为
            超过 的项目
            加载中

            评论(1)

            开源中国射线科科长
            开源中国射线科科长
            一股Py味~呵~一看就是Google的人开发的

            暂无资讯

            暂无问答

            NodeJS学习第一季-路由规则

            express 封装了很多http请求,下面将介绍如何获取http请求的参数和路由规则

            2015/07/29 22:08
            136
            0
            Kali Linux Web渗透测试视频?#22363;獺?#31532;十?#30446;?arp欺骗、嗅探\dns欺骗、session

            目录 Kali Linux Web 渗透测试—第十?#30446;?arp欺骗、嗅探、dns欺骗、session劫持 1 关于嗅探、arp欺骗、会话劫持.............................................................. 1 视频?#22363;?..

            2016/06/16 15:26
            141
            0
            25个简洁UI登录表单设计

            1. Nikerunning Nikerunning 2. RIPT apparel RIPT apparel 3. Appboy Appboy 4. Twitr designs Twitr designs 5. Voxtopia Voxtopia 6. Carbonmade Carbonmade 7. Tasty planner Tasty plan...

            2010/10/15 09:28
            2.8K
            0
            基于java swing的设备管理系统

            不写java swing挺久了,最近有人要帮忙,也?#25176;?#20010;熟熟手,把文档贴出来,嘿嘿。

            2016/06/29 13:05
            263
            0
            trap or bug when using CONTINUE in Oracle 11g

            CONTINUE is a new feature brought in Oracle 11g, but there is a trap or bug need to pay attention, see the following code scrap: DECLARE CURSOR dept_cur IS SELECT deptno ...

            2012/03/09 16:05
            22
            0
            xpath 问题汇总

            1. getting text after html tag with php and xpath http://stackoverflow.com/questions/12169275/getting-text-after-html-tag-with-php-and-xpath/16873625#16873625 I have the followi...

            2013/06/12 11:16
            42
            0
            【零基础学爬虫】scrapy框架的安装

            简介 scrapy是一个强大的异步爬虫框架,具有丰富的组件,有了scrapy框架,我们只需要关心爬虫的逻辑就可以了。 scrapy框架的安装 scrapy的安装有多种方式,它支持 Python2.7版本及以上或 Pyth...

            04/23 10:57
            0
            0
            【零基础学爬虫】scrapy框架的安装

            简介 scrapy是一个强大的异步爬虫框架,具有丰富的组件,有了scrapy框架,我们只需要关心爬虫的逻辑就可以了。 scrapy框架的安装 scrapy的安装有多种方式,它支持 Python2.7版本及以上或 Pyth...

            04/23 11:01
            0
            0
            【零基础学爬虫】scrapy框架的安装

            简介 scrapy是一个强大的异步爬虫框架,具有丰富的组件,有了scrapy框架,我们只需要关心爬虫的逻辑就可以了。 scrapy框架的安装 scrapy的安装有多种方式,它支持 Python2.7版本及以上或 Pyth...

            05/07 12:08
            0
            0

            没有更多内容

            加载失败,请刷新页面

            返回顶部
            顶部
            广东快乐十分实时开奖

                  <output id="ilehw"><bdo id="ilehw"><nobr id="ilehw"></nobr></bdo></output>
                  <dl id="ilehw"><font id="ilehw"></font></dl>

                            <output id="ilehw"><bdo id="ilehw"><nobr id="ilehw"></nobr></bdo></output>
                            <dl id="ilehw"><font id="ilehw"></font></dl>