您的当前位置:首页 >> 期刊文献 >> 正文
数字人文环境下古今汉语词汇长度探究
摘 要:
在数字人文和图书情报领域相融共生的背景下[1],本文基于计算机技术对古今汉语词汇长度进行了探究。首先人工录入《春秋经传引得(上册)》《春秋经传引得(下册)》《三国志》《汉书》《后汉书》《史记》六本先秦时期古文献词头,利用C语言程序对六本文献进行半自动分词。借助Excel统计分析软件,得出古籍文献词汇长度的分布情况,从而分析古人的用词习惯。再基于对现代汉语文本《人民日报》词频、词汇长度分布的统计,分析出古文本与现代汉语文本词汇长度的不同之处,比较古人与现代人在撰写文献时的用词习惯。
作 者:
  • 秦贺然
单 位:
    连云港中医药高等职业技术学校现代技术教育中心图书馆
关键字:
  • 数字人文;自动分词;词汇长度;文本挖掘;
页 码:
    87-88
出 处:
HTML阅读PDF文献下载您还没有登陆会员账号,请先登陆,在进行阅读或下载!
返回顶部 关注公众号