最简单demo
- 爬取内容
- mysql建表
- 正则匹配输入,设立规则,变为查询语句,输出
知识图谱
- 爬取内容。多源,异构
- mysql建表
- protege建立本体文件owl
-
- D2RQ将mysql表变为mapping文件以及rdf, 结合owl进行修改,融合。三元组。
- 或者用jena框架,直接上传rdf文件,owl提供推理功能
- 对输入进行对象级别的正则匹配。用sparql查询。
- 把表变为rdf
- 把sql换为sparql
- 把re换为refo
- 方便后续的推理。更加符合现实的结构关系。易扩展性
术语
- embedding: 让计算机理解人类语言.数学领域的有名词,是指某个对象 X 被嵌入到另外一个对象 Y 中,映射 f : X → Y ,例如有理数嵌入实数。
- Word Embedding 是NLP中一组语言模型和特征学习技术的总称,把词汇表中的单词或者短语映射成由实数构成的向量上(映射).一个词是一个向量
- one-hot, n-gram
- word2vec