http://www.slideshare.net/shizhao/hierarchical-network-of-concepts首创“立场过滤的概念
策略: “语义+统计”
(已完成校对的原型系统,语义的作用有待加强。)
过滤系统
意识形态过滤--区分正反两方面言论
必须依赖语言理解技术,必须进入语义和语境分析
关键词匹配和统计分类的技术在这里都显得力不从心
立场过滤
立场过滤:根据文本的立场,对反动言论实施过滤。
以邪教过滤为例,必须区分是宣扬邪教,还是批判邪教,而仅对前者实施过滤。
文本的立场体现在作者对文本中对象的言行的 褒贬 描述上。
例句:
1. 香港各界人士揭露 ××× 的真实面目。
2. ××× 是邪教。
4. ××× 不是邪教。
3. 美国谴责中国政府镇压 ××× 。
意识形态过滤系统
文章 句类分析 语义结构 语境生成 立场判断 红黑判断 短时记忆 文本要点框架 对象立场网络图
文本性质: 1 绝对黑, 2 绝对红, 3 黑, 4 可疑 Ⅲ, 5 可疑Ⅱ, 6 可疑Ⅰ, 7 中性
HNC概念知识库 HNC语义知识库 HNC褒贬语义知识库 红黑对象库
褒贬(bb)知识表示
Cbb 陈述者(作者)的褒贬 , 体现陈述者与陈述对象的立场关系
0 无褒贬倾向(为默认值,不必填)
1 绝对褒义词 陈述者与陈述对象立场一致
2 绝对贬义词 陈述者与陈述对象立场对立
3 相对褒义词 陈述者与陈述对象立场趋向一致
4 相对贬义词 陈述者与陈述对象立场趋向对立
5 相对褒义词 不表明陈述者的立场
6 相对贬义词 不表明陈述者的立场
7 绝对褒义词 不表明陈述者的立场
8 绝对贬义词 不表明陈述者的立场
Dbb 陈述对象的褒贬 , 体现第一陈述对象与第二陈述对象之间的立场关系 . 只用于涉及两个对象的 v 词语
0 无立场关系(为默认值,不必填)
1 一致,且第一对象对第二对象有褒义
2 对立,且第一对象对第二对象有贬义
3 一致
4 对立
Cbb Dbb
指责 0 2
谴责 3 2
揭露 3 2
反对 0 4
支持 0 3
赞扬 3 1
批评 0 2
批判 4 2
镇压 4 2
立场判断:对象立场网络图
美国谴责中国政府镇压 ××× 。
结论:作者是站在 ××× 的立场上的。