测绘通报 ›› 2016, Vol. 0 ›› Issue (2): 64-68.doi: 10.13474/j.cnki.11-2246.2016.0050.

• 学术研究 • 上一篇    下一篇

前后缀与特征词相结合的地名地址提取

王克永1,2, 刘纪平2, 罗安2, 王勇2   

  1. 1. 山东农业大学, 山东 泰安 271018;
    2. 中国测绘科学研究院, 北京 100830
  • 收稿日期:2015-01-27 修回日期:2015-11-06 出版日期:2016-02-25 发布日期:2016-03-08
  • 作者简介:王克永(1990-),男,硕士生,主要从事3S技术集成与应用。E-mail:yongkewang@126.com
  • 基金资助:
    国家863计划(2012AA12A402;2013AA12A403);中国测绘科学研究院基本科研业务费(7771403)

Extracting Toponomy and Location Based on the Combination of Prefix and Suffix with Feature Words

WANG Keyong1,2, LIU Jiping2, LUO An2, WANG Yong2   

  • Received:2015-01-27 Revised:2015-11-06 Online:2016-02-25 Published:2016-03-08

摘要: 随着地理信息与计算机技术的发展,网络中的非结构化地名地址数据越来越多,逐步成为地理信息更新的重要途径之一。针对互联网中地名地址的存在方式及结构特点,本文提出了一种前后缀与特征词相结合的地名地址识别提取方法。首先利用HMM训练进行分词,接着通过地名地址前后缀词库进行候选地名切分与预提取,最后根据特征词进行匹配过滤,实现对地名地址的准确提取。试验结果证明,本文方法提高了地名地址识别的准确率和召回率,很大程度上解决了未登录地址提取问题。

关键词: 前后缀, 特征词, HMM分词, 地名地址

中图分类号: