Research

cryptomining farm

知识图谱构建

知识图谱的构建是一个浩大的工程,从大方面来讲,分为知识获取、知识融合、质量控制、图谱存储与查询、图谱可视化、知识计算和应用几个部分。

  • 知识获取:从百科、互联网各类结构化非结构化数据源抽取知识;
  • 知识融合:涉及实体融合、属性和关系融合、属性值归一化等;
  • 质量控制:涉及知识补全、知识清洗、知识更新等;
  • 存储查询:涉及各类关系型、NoSQL与图数据库及查询优化等;
  • 知识计算:涉及知识理解、知识推理、机器自动学习等;
  • 知识应用:涉及智能搜索与推荐、智能客服、个人助理、智能问答等。
数据清洗

数据清洗是对关系数据库、知识库、知识图谱等数据表示方式中的数据进行质量控制,具体包括:

  • 数据融合:融合不同来源的数据,统一表达方式;
  • 数据补全:发现并补全目标库中的缺失数据;
  • 数据清洗:发现并纠正目标库中的错误数据;
  • 数据更新:发现并更新目标库中的过期数据。
问答系统

让机器具备与人的对话能力是目前人工智能领域最为热门的研究课题。

  • 知识类问答:基于知识图谱的问答系统;
  • 检索式问答:基于已有问答库的问答方式;
  • 生成式问答:训练通过seq2seq及其变种的模型,问答闲聊类问题;
  • 抽取式问答:建立模型,从相关文档中抽取出问题的答案;
  • 多轮交互问答:智能客服、个人助手等多轮交互场景的问答。
智能推荐

随着大数据、社交网络、深度学习等技术的发展,推荐系统变得日益智能。

  • 基于深度学习的推荐:各类基于深度学习模型的推荐;
  • 基于社交网络的推荐:利用社交信息来建立推荐关系;
  • 基于知识图谱的推荐:利用知识图谱来建立推荐关系;
  • 面向临时团队的推荐:面向临时团队进行相关推荐。