概览

通过资讯检索接口,开发者可以对小理简报的海量行业信息进行检索,并且定义复杂的基于关键词的检索条件。

基础检索

根据简单的关键词组合检索资讯。

请求地址

URL地址:https://api.xiaoli.ai/v1/api/search/basic

请求方式:POST

请求参数

字段 名称 取值 备注
token 访问凭证 必选
keywords 关键词列表 字符串组成的list 必选
match_type 匹配策略 0:匹配keywords中任意关键词;1:匹配keywords中全部关键词 可选,默认为0
match_field 匹配范围 0:智能匹配;1:在标题中匹配;2:在正文中匹配 可选,默认为0
page_no 分页 - 开始页 整数类型,起始值为1 可选,默认为1
per_page 分页 - 每页条数 取值范围:1~50 可选,默认为5

请求数据示例:

{
  "token": "AppSecret",
  "match_type": 0,
  "match_field": 0,
  "keywords": [
    "马云",
    "阿里巴巴",
    "淘宝"
  ],
  "page_no": 1,
  "per_page": 5
}

响应结果

字段 名称 取值 备注
contents 资讯列表 JSON数组 注意如果未查询到内容,该字段可能为空数组(“[ ]”)
contents.url 资讯URL
contents.title 资讯标题
contents.news_abstract 资讯摘要 可能为空。摘要由算法自动生成,最多4段话,用“...”分隔 开发者可根据需求截取其中部分内容
contents.pub_date 资讯发布时间 可能为空。时间由算法自动抽取,所以可能存在错误或者为空
contents.seed_title 来源名称 请在显示资讯的同时注明来源
contents.img_url 图片地址
page_no 分页 - 当前页
per_page 分页 - 每页条数
total_count 分页 - 总新闻条数
total_pages 分页 - 总页数

返回数据示例:

{
    "data": {
        "contents": [
            {
                "img_url": "https://img.xiaolizhuli.com/get/0ac8a891-9488-4fc7-9592-052a41a106a4uuid-namedb05005ca320a2e.png",
                "news_abstract": "...12月14日消息,上周四,阿里巴巴刚刚同福特汽车签署战略合作协议,其中涉及到在天猫上出售福特汽车。现在,阿里巴巴已经将汽车自动贩卖机已经落实到行动。据外媒报道,阿里巴巴计划在南京和上海开设两家大型自动贩卖机,这将使潜在买家有机会看到、试驾、甚至在现场购买他们选择的汽车。是的,你没看错。欢迎来到2017年。",
                "pub_date": "2017-12-14T02:45:34",
                "seed_title": "CNBeta",
                "title": "阿里启动汽车自动贩卖机项目",
                "url": "http://www.cnbeta.com/articles/tech/679729.htm"
            },
            ...
        ],
        "page_no": 1,
        "per_page": 5,
        "total_count": 20,
        "total_pages": 4
    }
}

高级检索

支持复杂的查询条件,条件之间可以设置复杂的逻辑关系。

请求地址

URL地址: https://api.xiaoli.ai/v1/api/search/advance

请求方式:POST

请求参数

字段 名称 取值 备注
token 访问凭证 必选
queries 关键词列表 用JSON数组的形式表示 必选
queries.keywords 关键词列表 字符串组成的list 必选
queries.match_type 匹配策略 0:匹配keywords中任意关键词;1:匹配keywords中全部关键词 可选,默认为0
queries.match_field 匹配范围 0:智能匹配;1:在标题中匹配;2:在正文中匹配 可选,默认为0
page_no 分页 - 开始页 整数类型,起始值为1 可选,默认为1
per_page 分页 - 每页条数 取值范围:1~50 可选,默认为5

关于queries的说明

在基础查询接口中,每一次查询相当于一个简单查询条件q,是由匹配策略、匹配范围和关键词列表组成的三元组,即 q = (match_type, match_field, key_words)

在高级检索接口中,查询条件Q是由一组简单查询条件组成,查询条件之间可以定义逻辑关系(与、或、非)。这里约定,目前高级检索接口中简单查询q按照析取范式进行组织,支持两级关系。

具体而言,queries是一个两级数组: 第一级数组之间是“或”的关系 第二级数据内部是“且”的关系

例如,Q = ( q1 ∩ q2 ∩ ~q3) ∪ (q3 ∩ q4),这里每一个q都是一个简单查询条件,即 q = (match_type, match_field, key_words)

下面的示例代码表示“(同时包含‘京东’和‘刘强东’,但不包含‘奶茶妹妹’)或者(包含‘李彦宏’或‘马化腾’或‘马云’)”

{
  "token": "AppSecret",
  "queries":[
        [
            {
                "match_field": 1,
                "match_type": 1,
                "keywords": ["京东", "刘强东"]
            },
            {
                "match_field": 1,
                "match_type": 2,
                "keywords": ["奶茶妹妹"]
            }
        ],
        [
            {
                "match_field": 1,
                "match_type": 0,
                "keywords": ["李彦宏","马化腾","马云"]
            }
        ]
    ],
  "page_no": 1,
  "per_page": 5
}

响应结果

响应结果与基础检索接口相同。