自然语言 APIs

自然语言APIs是一系列能将非结构化数据转换为结构化数据的自然语言处理工具集,这些工具能够对文档进行分析并帮助用户理解文本中的实体、属性、关系等信息。

Demo


实体检测 API

实体检测API对文本中的命名实体进行定位并将其进行分类为人名、地名、机构名等预先定义好的类别。将纯文本作为输入到实体检测API,将返回文本中所有的命名实体以及其在文本中的位置和实体标签。特别地,我们提供生物医学领域内疾病和化学药物的实体检测。

输入:纯文本

输入格式:Json

输出:实体名、实体在文本中的位置以及实体类别

输出格式:Json

URL: https://api.ksstudio.org/entitydiscovery

Example


实体链接 API

实体链接API接收文档中的文本作为输入,API最开始会调用实体检测API来找出文档中的实体名称,并将这些实体名称链接到知识库中相应的实体上。我们将这些实体链接到维基百科、MeSH和ChEBI三个知识库。当检测到的实体名称能够指代多个不同实体时,本API会更加有效。例如:“克林顿”可能指向希拉里·克林顿或者比尔克林顿,在这种情况下我们会将其链接到最适应上下文的结果中。

输入:纯文本

输入格式:Json

输出:实体提及信息的列表。对每个实体,输出包含其在输入文本中的位置、其实体类型以及其链接到知识库的ID,只有当实体能够链接到知识库时才会显示相应知识库的ID。

输出格式:Json

URL: http://api.ksstudio.org/entitylinking

Example


属性填充 API

属性抽取API接收文本作为输入,系统可以查找文本中的候选句并进行标签,最终输出药物所导致的疾病。

输入:纯文本

输入格式:Json

输出:药物导致疾病

输出格式:Json

URL: http://api.ksstudio.org/slotfilling

Example


开放领域关系抽取 API

开放领域关系抽取API从纯文本中抽取典型的二元关系。开放领域关系抽取与一般关系抽取的区别在于关系是非预先定义的,关系从文本中来且联系其相关的两个参数。例如,对句子“Barack Obama was born in Hawaii.”,抽取得到的关系三元组为(Barack Obama, was born in, Hawaii),对应的关系为was born in(Barack Obama, Hawaii)。

输入:纯文本

输入格式:Json

开放领域关系三元组

输出格式:Json

URL: https://api.ksstudio.org/openie

Example


百科 API

输入实体名称,返回实体列表,点击实体,返回相应的信息框和摘要。




阅读理解API

输入一段文章和一个问题,返回相应的候选答案和分数。