【语料库语言学】 第三章 语料库的类型和语料库的构成

作者&投稿:兆贷 (若有异议请与网页底部的电邮联系)
~


深入探索语料库的多样性与构成,Understanding Corpus Linguistics by Danielle Barth和Stefan Schnell为我们揭示了语料库世界中的核心概念。


语料库的规模并非越大越好,而是需与研究问题相匹配。衡量标准如词形标记数,受到文本类型和可用资源的限制,COCA和ICE等项目致力于增加口语文本,以反映语言使用的实际多样性。


语料库的构成是关键,追求平衡是核心原则,不仅要涵盖不同情境下的文本,如正式与非正式的英语,还要确保真实性和自发性的准确反映。代表性是衡量其与实际语言使用的相似度,包括规模、文本多样性以及涵盖的交际情境。


3.1.4.1 代表性与规模: 选择性地缩小规模可能牺牲了多样性,研究者需在大型与全面性之间找到平衡,以反映真实语言的广泛性。


3.1.4.2 代表性与组成: 通过精心组合不同文本类型和情境,确保研究结果不受偏见影响,实现语言使用的全方位展示。

饱和度是追求全面覆盖的语言现象,尽管难以实现完全饱和,但通过持续更新和扩展,语料库始终在接近理想状态。文本的变体,如语域、体裁和风格,为研究提供了丰富的视角,如口语文体的元数据和多语言研究的特性。


原始数据与元数据的区分,如语音库与标记语料库,揭示了语料库数据的深度和精确度。分类上,通用与特殊语料库各有侧重,比如学习者语料库和网络语料库,它们各自代表不同的语言使用情境。


动态与静态,单语与多语: 语料库的动态性确保了持续更新,而静态语料库如大型参考库则追求最大程度的代表性。单语与多语的选择取决于研究目的,如平行语料库对比不同语言间的差异。

总的来说,语料库语言学不仅关注语言的表面结构,更深入到语言使用的深层次分析,每一种类型和构成都为语言研究提供了独特的视角和丰富的资料来源。




中山区13511589657: 什么是“语料库语言学?” -
学胜散结:[答案] 语料库语言学是20世纪80年代才崭露头角的一门交叉学科,它研究自然语言文本的采集、存储、加工和统计分析,目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统...

中山区13511589657: 到底什么叫做语料库呢?
学胜散结: 简单地说,语料库就是语言材料的仓库.在语言学研究中,搜集大量的语言材料,比如报章杂志、文学作品、 科普读物等,经过整理后,可以进行统计、对比,还可以进一步用 统计结果进行语言学研究.现在所说的语料库,一般都指利用计算 机存储,按照各种格式要求整理、标记,能够实现计算机统计的数 字化语料库.它是语言学很多方面研究的基础资源.根据不同的研 究需要,语料库里收集的资料会有所侧重,规模大小也会有所不 同.比如要研究古代汉语,语料库的材料就应该是古文,要研究外 国人学习汉语的情况,就要大量收集外国学生写的汉语文章, 等等.

中山区13511589657: 语料库语言学中的coding是什么意思 -
学胜散结: coding 编码 例如: You'll also notice a bit of color coding on the maps. 你同样会注意到地图上有一些彩色编码.Must be able to design and set up the page, including any necessary codingwork. 必须能够设计和建立网页,包括任何必要的编码工作.However, if accompanied by a physician, up to three office coding staff mayalso attend. 但是,如果由医生陪同下,最多三个办公室编码人员也可参加.

中山区13511589657: Language in use 是什么意思 -
学胜散结: 1 使用中的语言 是语料库语言学概念,指真实文本中的语言 2 语言运用句子可以脱离语境而独立存在,是离境化的,而语篇常用被定义为语言的使用,即语篇是语言在一定场合中被使用的现象,是语言的具体使用,体现了语言作为一种交际工具...

中山区13511589657: 语料鉴别是什麽意思 -
学胜散结: 语料库的使用早在几百年前就开始了(Kennedy 2000: 13-15).但是,过去的“语料库”是非计算机操作,人们把需要的句子抄在卡片或纸条上,然后对其检索.所以,这种现象我们只能称之为语料库方法,而非现代意义上的语料库...

中山区13511589657: 海量知识 如何表述 -
学胜散结: 计算机硬件、网络和软件技术的发展,使人们信息交流的手段变得更迅捷,信息交流的深度和广度也得到更大的拓展.譬如,通过互联网人们可以及时获取到以前不可想象的巨大信息.然而,海量信息的扑面而来同样使我们陷入困境:一方面是...

中山区13511589657: 英语语料库是什么? -
学胜散结: 这怎么解释...就是像雅思听力语料库就是把雅思听力考试中最常出现的一些考察方式拿出来专门训练...比方说一长串数字的听写:电话号码之类的...

中山区13511589657: elt英语培训
学胜散结: 私信回答你了哦,我也跟老师说了你的情况.对了,还有我之前收藏的一些相关信息... Teaching and Research语言教学研究方面的语料库语言学. 研究不同发音,不同语...

中山区13511589657: 学什么是“词汇化”和“语法化” -
学胜散结: 传统的语言教学观认为语言是词汇化的语法,即语言被视为词汇通过一定的语法规则而生成.然而语言学尤其是语料库语言学的研究结果揭示自然语言中存在着大量的兼有句法和词汇特征的固定或半固定的语言结构,这些模式化的结构以整体形...

中山区13511589657: 北京大学汉语语言学研究中心(语料库) -
学胜散结: 北京大学汉语语言学研究中心的三个语料库:# 现代汉语语料库http://ccl.pku.edu.cn/yuliao.asp?item=1# 古代汉语语料库http://ccl.pku.edu.cn/yuliao.asp?item=2# 汉英双语语料库http://ccl.pku.edu.cn/yuliao.asp?item=3 前两个可以在线检索,第三个只限北大校内检索. 总体检索界面和速度比国家语委现代汉语语料库要好多了.

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网