本文共 1383 字,大约阅读时间需要 4 分钟。
corpus of ,corpora语料库
severely degraded 严重退化
this paper address this issue by本文通过。。方法解决了这个问题
part of speech tagging 词性标注
novel 新颖的
leverage 利用
redundancy inherent固有的冗余
exploit利用
supervision监督
outperform == perform batter than
compilation 汇编
inclusive广泛的
proliferation增殖,扩散
previously-tagged out-of-domain text 以前标记的域外文本
a plethora of distinctive 一大堆特色的
relatively infrequent 相对少见的
manually annotated 手动注释
segment 分割
shallow浅的,浅陋的
syntax 语法
parsing 解析
informativeness 信息量
capitalization 大写
fundamental 基本的
noun-phrase名词短语
chunking 组块
feature generation特征生成
4-fold cross-validation 4倍交叉验证
applicable 适用
prior experiments 先前的实验
baseline 底线
Out of Vocabulary (OOV)word 词典外的词
exposing 揭发,曝光
grammatical语法的
spelling variation 拼写差异
fraction 分数
collapse 倒塌、崩溃、压缩
compactness 紧凑、简洁
vice versa 反之亦然
interjection 叹词
specific phenomena 具体现象
postprocessing 后期处理
lexical variation 词汇变异
clustering 簇,集群
distributionally 分布式地
hierarchical 分级、阶级式、层级
adjacent 邻、邻近的
prepositional phrase 介词短语
incorporate 合并
convention 惯例
deliberately 故意地
unambiguous 明确的
trivial 不重要的
inflate 膨胀
ambiguity 歧义
associated 相关的
profile 轮廓、侧面
contextual 上下文
represent 代表
inference 推理、推论、论断
orthographic 正字、拼字正确的
terse 简洁
broad coverage 广阔的覆盖
abbreviated 简短的、简写
in contrast to 对比
generative 生成的
integrated 集成
encounter 遭遇
benchmark 基准、评估
investigate 调查、研究
evaluate 评估
joint 联合、协同
snippet 片段
relevant to 与...相关
a big margin大幅度
转载地址:http://uedvi.baihongyu.com/