术语表

欢迎来到我们的术语表页面。这里汇集了我们在翻译过程中使用的所有关键术语及其定义（但不一定被翻译到目标语言），旨在确保翻译的一致性和准确性。我们鼓励您在阅读翻译文档之前，先浏览这个术语表，以更好地理解文本中使用的专业术语和概念。

术语表中的术语按照翻译的顺序（通常也是在目录中的顺序）排列，您可以快速查找到所需的术语。如果您在使用翻译文档时遇到任何术语上的疑问，本术语表将是您理想的参考资源。术语表会定期更新，以反映最新的翻译实践和行业标准。

部分术语不会被纳入术语表，例如 C++、Unicode 等，不会被纳入术语表的术语通常具有以下一些特点：

通用性：日常用语或非常普遍的词汇，不需要专业解释即可被广泛理解。
非专业性：不属于特定领域或行业的术语，不涉及专业或技术性内容。
简单性：含义简单明了，不需要进一步解释或定义。
无歧义性：没有多种含义或解释，不会引起混淆或误解。
翻译的困难性：不适合被翻译、翻译困难、翻译后可识别性相较于原文有所下降，或翻译后过于冗长。
没有纳入术语表的必要：原文已经给出解释，或曾经出现过并被收录到术语表中。

特定的未被纳入术语表中但需要解释的词，会以译者注或注zhù音 yīn符fú号hào的方式插入文档中。

术语表中的部分术语看起来并不像一个术语，为了提醒您可以在术语表中找到它，我们会在文章中它第一次出现的地方为其加上斜体，例如：初次启动。

凡被决定要被翻译的术语，将会优先选择被公认的译名，其次是有争议但被权威网站（如 cppreference 或维基百科）采用的译名（如“词语定序”），再其次是有参考性但可能与原文稍有不同的译文，再其次是自定译名或由 AI 生成译名，最后会考虑是否不译。

我们致力于提供高质量的翻译文档，希望这个术语表能够帮助您更深入地理解文档内容，避免因术语差异而产生的误解。如果您有任何建议或需要进一步的澄清，请随时与我们联系。

请自行查证！

术语表中的定义一列中给出的都是简单的定义，仅供速查使用，可能并不完全正确，请独立思考，自行查证。

术语	原文	定义
穷举测试	Exhaustive Tests	穷举测试是一种测试方法，其中所有可能的数据组合都用于测试。
贡献者许可协议	CLA 或 Contributor License Agreement	项目接收贡献者提交的 PR 之前，需要贡献者签署的一份协议，协议只需签署一次，对该贡献者的所有提交都生效
PR	PR 或 Pull Request	PR 是一种代码协作流程，允许开发者向一个共享的代码仓库提交他们的更改，请求仓库的维护者审查并合并这些更改。
代码规范	Coding Guidelines	代码规范是一套规则和最佳实践，用于指导编写清晰、一致和可维护的代码。
源码访问权	Source Code Access	能够查看、编辑和使用软件的源代码的能力。
工单生命周期	Ticket Life cycle	工单（如 Issues 等）从创建、处理到关闭的整个流程和状态变化周期。
国际化	i18n	i18n 是 internationalization 省略中间18个字母的缩写，通常用于指代软件或文档支持多语言环境的能力。
基础知识	Basics	基础知识（通识），是指人们通过各种媒体和书籍所获取到的知识。
术语表	Glossary	指的是 ICU 文档自身就有的术语表，和本页这个术语表不一样。
常见问题与解答	FAQ 或 Q&A	是在长期或大量接获特定的疑问、询问或疑难问题并加以回复后，从中加以归纳整理成的问答集。
字符集探测	Charset Detection	一种用于猜测代表文字的一系列字节的字符编码的启发式算法。
世界时标	Universal Time Scale	似乎是 Universal Time 和 Time Scale 的结合。
老式	Legacy	参考 cppreference，将 Legacy 译为“老式”。
舍入模式	Rounding Modes	舍入模式是指在数学计算中对浮点数进行四舍五入时所采用的规则或方法，以确定当数字位于两个整数之间时应向上舍入还是向下舍入。
基于规则的数字格式化	RuleBasedNumberFormat	RuleBasedNumberFormat 是一种基于规则的数字格式化工具，它能够根据预定义或自定义的规则将数字转换为拼写出的文本形式，如英文的 "one hundred and thirty-four" 或德文的 "hundertvierunddreissig"，并支持序数和持续时间等特殊格式。
大小写变换	Case Mappings	又译作“大小写映射”，指的是一种将字符从一种字母大小写形式转换为另一种形式的规则集合，例如将小写字母转换为大写或反之。
正规化	Normalization	Unicode 正规化是文字正规化的一种形式，是指将彼此等价的序列转成同一列序。
词语定序	Collation	或称“定序”（暂无公认译名），是指在计算机科学与图书馆学、词典编撰中书写信息的标准排序。
文本边界分析	Boundary Analysis	ICU 的 Break Rules 定义了文本边界分析的规则，这是一种在文本格式化和处理过程中定位语言边界的方法，包括单词换行、文本选择、字符计数、光标移动、唯一单词列表制作、文本范围完整性判断、单词首字母大写以及特定文本单元定位等任务，由 BreakIterator 类支持，确保文本操作的准确性和一致性。
断句规则	Break Rules	ICU 的 Break Rules 是通过类似于正则表达式的规则来定位文本中的边界位置，这些规则与 Unicode 规范中的边界规则相似但并不完全相同，它们定义了如何从已知边界向前移动到下一个边界，并允许应用程序创建自定义的断句迭代器。
字典树	Trie	Trie（字典树或前缀树）是一种用于快速检索和存储字符串数据集中的键的树形数据结构，其中每个节点代表根到该节点的路径上字符串的共同前缀。
码位	Code Point	码位是表示文本的系统（例如 Unicode）中用于表示抽象字符的数值。Unicode 标准中的码位是用于唯一标识字符的数字，它是一个从 0 到 11141110x10ffff 的非负整数，代表 Unicode 字符集中的字符。
Unicode 字符数据库	UCD	Unicode Character Database 的缩写，是 Unicode 联盟维护的一个详尽的数据库，包含了每个 Unicode 码位的详细属性和行为信息，用于支持 Unicode 标准的各种实现。
持续整合	Continuous Integration	又译为持续集成，是一种软件工程流程，是将所有软件工程师对于软件的工作副本持续集成到共享主线（mainline）的一种举措。
模糊测试	Fuzzer	模糊测试是一种软件测试技术。
通用当地数据存储库	CLDR	通用当地数据存储库项目，是 Unicode 联盟的项目，旨在以XML格式提供用于计算机应用程序的区域设置数据。
计量单位	MeasureUnit	ICU 的 MeasureUnit 是一个表示和处理国际度量单位的类，它提供了一系列标准化的度量单位常量，支持度量值的格式化、解析和单位转换功能。
Callgrind	Callgrind	Callgrind 是 Valgrind 工具套件中的一个性能分析工具，用于收集和报告程序的低级性能分析数据，帮助开发者识别性能瓶颈。
Ant	Ant	Ant 是 Java 的一个基于 XML 的构建工具，用于自动化编译、打包和测试等软件开发过程中的构建任务。
Eclipse	Eclipse	Eclipse是一个多功能、开源的集成开发环境（IDE），主要用于Java开发，但通过插件支持多种编程语言，提供代码编辑、编译、调试和测试等综合开发工具。
Maven	Maven	Maven 是一个 Java 项目管理和构建自动化工具，使用中央仓库和依赖管理技术，通过POM文件定义项目构建流程和依赖关系，以简化构建过程并提高开发效率。
JDK	Java Development Kit	JDK 是一个全面的软件开发环境，包含了 Java 编程语言和开发工具，允许开发者创建、编译、执行 Java 应用程序和小程序。
ICU4J	ICU for Java	ICU4J 是一套 Java 库，为 Java 平台提供全面的 Unicode 支持和国际化服务，包括文本处理、日期/时间格式化、校对排序等，以增强 Java 应用的本地化和全球化能力。
ICU4C	ICU for C / C++	ICU4C 是一套用 C 和 C++ 编写的国际化和本地化库，提供 Unicode 支持、文本处理、日期和时间格式化等功能，用于软件开发以实现跨语言和跨区域的兼容性。
区域设置	Locale	区域设置（locale）是一套用于定义特定地理、语言或文化环境的标准，它决定了软件如何根据用户的地理位置和语言偏好来显示日期、时间、货币、数字和文本方向等信息。
塞尔维亚语西里尔文字	Cyrillic-Serbian	塞尔维亚语西里尔文字是塞尔维亚语使用的一种书写系统，基于西里尔字母，它包含了用于表达塞尔维亚语特有语音的字母，广泛用于塞尔维亚、黑山、波斯尼亚和黑塞哥维那等地区的塞尔维亚语方言。
文化假定	Cultural Assumptions	文化假定是在某个社会中经由教育而被接受下来的那些未经评估的（常常是隐含的）信念。
ResourceBundle	ResourceBundle	ICU 的 ResourceBundle 是一个国际化支持框架，它通过集中存储和管理与特定区域设置相关的本地化资源，使得软件能够根据用户的地理位置和语言偏好显示和处理数据。
布局引擎	LayoutEngine	ICU 的 LayoutEngine 是一个用于将 Unicode 文本转换为视觉顺序的字形代码，并支持复杂文本布局，包括多脚本和双向文本的国际化文本布局库。
按位的	Bit-wise	以位（bit）为最小操作单元的操作。
字符分类函数	字符分类函数	头文件 cctype 或 ctype.h 中提供的一系列函数。
罗塞塔石碑	Rosetta Stone	罗塞塔石碑是一块公元前196年刻写的古埃及石碑，因其上用三种文字（古埃及象形文字、埃及草书和古希腊文）书写了相同的内容，使得近代学者能够解读失传千年的古埃及象形文字，对研究古埃及文明有着极其重要的意义。
夏令时	Daylight-savings Time	夏令时是一种在夏季月份牺牲正常的日出时间，而将时间调快的做法。
文字	Script	文字是人类用来记录和传播语言的书写符号系统，可单独或经组合表达某种或某些语意信息。
拉丁字母	Latin Scripts	拉丁字母是一种广泛使用的字母系统，起源于罗马帝国，现为多种语言的官方书写系统，包括英语、西班牙语、法语和意大利语等。
Makefile	Makefile	Makefile 是一个特殊格式的文件，用于指导 make 工具自动编译和链接程序，它定义了软件构建过程中的依赖关系和构建规则，是自动化构建系统的核心组件。
挑选	Cherry-picking	仅仅只是“挑选”的意思，而并非“单方论证”。
构建系统	Build System	构建系统是一个自动化工具或一组指令，用于编译源代码、链接生成可执行文件，并处理软件构建过程中的其他相关任务，以确保软件按照预定的方式正确构建。
配置标志	Configure Flag	Configure flag（配置标志）是在软件包的配置脚本中使用的一个选项，用来在编译和安装软件之前定制软件的行为或功能。
初次启动	Initial Bring-up	"Bring-up"通常指的是在计算机系统、软件或硬件设备上初始化和配置的过程，使其从启动状态过渡到完全运行和操作就绪的状态。
回溯兼容	Backward Compatibility	又称“向下兼容”、“向后兼容”，指的是新版本的程序能够正常使用旧版本的数据。为了消除歧义，翻译成无歧义的“回溯兼容”。
前置声明	Forward Declarations	也被称作“前向声明”，请参考 cppreference 上的介绍。
using 声明		请参考 cppreference 上的介绍。
翻译单元	Compilation Unit	请参考维基百科或 cppreference 上的介绍。
代码页	Codepages	代码页是字符编码的别名，也称内码表，是特定语言的字符集的一张表。
位表示	Bit Representation	位表示是指使用二进制位来表示数据或信息的一种方式，它是计算机科学中最基础的数据存储和处理形式。
Repertoire	Repertoire	Repertoire 是某个系统、编码或标准所能表示或包含的全部字符、符号和标记的集合。
互操作性	Interoperable	互操作性指的是不同的系统、设备或应用程序能够无缝交互和协同工作的能力，不受特定制造商或技术平台的限制。
互联网标准	Internet Standards	互联网标准是一套公开、无阻碍、开放开发的技术规范，由全球技术专家协作制定，确保互联网的互操作性和持续发展。请参考 The Internet and Standards
字形与字符的区别	Glyphs versus Characters	Glyphs versus Characters 指的是在文字处理中，字符（作为语言的抽象符号）与其字形（作为字符的视觉表现形态）之间的对比关系。
连字	Ligature	连字（Ligature）是指将两个或多个字符以特殊的方式组合在一起，形成一个单一的字形，常见于某些字体设计中，用以提高文字的可读性或美观性。
单一编码字符集	Single-coded Character Set	单一编码字符集是一种字符编码系统，它为每个字符或符号分配唯一的编码值，确保每个字符在不同平台和设备上都能以统一的方式表示和交换。
变音符号	Umlauts	变音符号（Umlauts）是一种使用两点（"¨"）标记在字母上以表示特定音素变化的字符，常见于德语及其他一些使用拉丁字母的语言中，用以区分不同的发音和词汇意义。
良定义	Well-defined	良定义（well defined）就是指无歧义的、不会导致矛盾的、符合其应满足的所有要求的定义。
空间	Elbow Room	俚语，意为自由度或活动空间。
增补字符	Supplementary Characters	增补字符是Unicode编码中用于表示超出基本多语言平面（BMP）范围的字符，具有从 $U + 10000$ 到 $U + 10 F F F F$ 的编码值，需要用两个16位代码单元来编码。
基本多语言平面	BMP	基本多语言平面（BMP）是Unicode编码空间中包含从U+0000到U+FFFF码点的第一个平面，它覆盖了大多数常用书写系统的基本字符集。
码元	Code Unit	码元（Code Unit，也称“代码单元”）是指一个已编码的文本中具有最短的比特组合的单元。
互联网号码分配局	INNA	互联网号码分配局是全球互联网关键资源的协调和分配机构，负责域名、IP 地址和协议编号系统等的管理和维护。
基于字典序的比较	Comparing Lexically	字典序（Lexicographical Order）是一种基于字符在字典中出现的顺序来排列字符串的顺序规则，通常用于按照字母或数字序列对文本数据进行排序。
有状态	Stateful	Stateful（有状态的）指的是在处理数据或执行操作时需要维护和依赖于先前状态信息的特性，这通常意味着系统的当前行为受其历史状态的影响。这使得 SCSU 的解压缩必须按照压缩数据的顺序进行，不能随机访问。
8 位邮件	8-Bit Emails	8 位邮件（8bit emails）是一种电子邮件编码方式，允许邮件内容使用全部8位字节来表示字符，从而能够传输包括非ASCII字符在内的更广泛的数据类型。
Base64 编码	Base64-encoded	Base64 编码是一种用 64 个可打印的 ASCII 字符表示二进制数据的编码方法，它将二进制数据转换成 64 个字符的集合，每个字符代表 6 位原始数据，通常用于在文本格式中安全地传输二进制数据。
EBCDIC 编码	EBCDIC	EBCDIC（Extended Binary-Coded Decimal Interchange Code）是一种8位字符编码系统，最初由IBM开发，用于其主机计算机系统，以十进制数字的二进制编码为基础，支持多种语言字符和特殊图形符号。
Open Interchange	Open Interchange	Open Interchange是一种早期提出的电子邮件和消息系统互操作性文件格式标准，旨在统一不同平台间消息数据的交换方式，但最终未被广泛采用，并被 MIME 取代。
Singletons	Singletons	在 Unicode 字符数据库中， Singletons 是指那些和其它单一字符有相同分解的字符。
字位	Grapheme	字位又称形素、字素，是最小的有意义书写符号单位；此术语是由语音学里的“音位”（音素）类推到文字学的。在拼音文字系统当中，“字位”是最小且数量最少的区别性单位，也是一个抽象单位。
字位簇	Grapheme Cluster	字位簇是一个或多个 Unicode 码位的序列，必须将其视为一个单独的、不可分割的字符。
说明	Specification	N/A
网际协议	Internet Protocols	网际协议（英语：Internet Protocol，缩写：IP），又称互联网协议，是互联网协议包中的网络层通信协议，用于跨网络边界分组交换。它的路由功能实现了互联互通，并从本质上建立了互联网。
零宽不换行空格	ZERO WIDTH NO-BREAK SPACE	零宽度不换行空格通常用作文本处理中的占位符，用于表示空格的存在，但却不会在文本换行时产生断行。与普通的空格字符不同，零宽度不换行空格在文本中是不可见的。
单词连接符	WORD JOINER	U+2060 WORD JOINER 是一个Unicode格式字符，用作零宽度非断行空间，主要用于文本处理中防止单词间的连字现象，并在确定字节顺序时提供辅助。
启发式算法	Heuristics	启发式算法是一种基于经验和直觉的解决问题方法，它通过使用一些实用的、非精确的规则或策略在合理时间内找到一个可接受的解，而不是总是寻找最优解。
转写	Transliteration	转写是一种将文本从一种字符集或文字系统转换为另一种字符集或文字系统的处理过程，通常用于跨语言和跨文字系统的文本表示和数据交换。转写不是音译，转写关注的是文字的视觉转换，而音译关注的是发音的转换。
公历	Gregorian Calendar	公历（又称阳历、格里高利历）是一种国际上广泛采用的太阳历，通过 1582 年教皇格里高利十三世的改革，修正了儒略历的时间累积误差，以更准确地对齐日历年与太阳年。
意义	Purpose	N/A
封装	Encapsulate	N/A
表	Table	一类数据结构的统称。
单一 UNIX 规范	Single Unix Specification (SUS)	单一UNIX规范是一套 UNIX 系统的统一规格书，扩充了 POSIX 标准，定义了标准 UNIX 操作系统。
更细粒度	Finer-grained	N/A
定义不明确	Not Well Defined	“良定义”（见上）的反义词。
健壮	Robust	健壮性指的是系统或软件在面对错误、异常或压力时仍能保持正常运行和性能的能力。
Code Drop	Code Drop	Code Drop 指的是软件开发过程中一个特定的代码版本，它经过了测试并准备好被集成、部署或发布。
内存映射文件	Memory Mapped File	内存映射文件，或称“文件映射”、“映射文件”，是一段虚内存逐字节对应于一个文件或类文件的资源，使得应用程序处理映射部分如同访问主内存。
内存一致性	Memory Coherency	内存一致性是指在多线程环境中，不同线程对共享内存的读写操作能够反映出最新的值，保证所有线程看到的内存状态是一致的，从而避免由于缓存、延迟写回等原因导致的数据不一致问题。
HP-UX	HP-UX	HP-UX 是惠普科技以 System V 为基础所研发成的类 UNIX 操作系统。
Solaris	Solaris	Solaris 原先是太阳微系统公司研制的 Unix 操作系统，在 Sun 公司被 Oracle 并购后被称作 Oracle Solaris。
伪锁冲突	Spurious Lock Conflict	伪锁冲突是指在多线程或多进程环境中，由于锁机制的存在，即使线程或进程的访问实际上不会相互冲突，它们之间仍可能发生不必要的等待和阻塞现象。
递归锁失败	Recursive Mutex Failure	递归锁失败是指在多线程编程中，当递归锁的内部计数机制或同步逻辑出现问题，导致同一个线程无法正确地重复获取或释放锁，从而可能引起死锁或资源同步失败的情况。
同步原语	Synchronization Primitive	同步原语是多线程编程中用于控制对共享资源访问的机制，确保线程安全和数据一致性的基本工具，例如：互斥锁、信号量、条件变量、屏障、原子操作、事件等
Copyleft	Copyleft	Copyleft是一种软件许可证策略，要求派生作品也必须在相同的许可证下发布，确保了自由软件的自由度和可修改性得以保留和传播。
自举	Bootstrap	ICU 自举是指 ICU 库在构建过程中首先创建一个基础的 stub 数据库，以便其构建工具能够运行并最终生成完整的数据库，实现自我启动和扩展的过程。
拉丁文扩展	Latin Extensions	拉丁文扩展是在基本拉丁字母表基础上增加的变体字母或带变音符号的字母，用于扩展拉丁字母的表达能力，以适应多种语言的发音需求。
名字修饰	Name Mangling	名称修饰（Name Mangling）是一种编译器用来编码函数名和变量名的机制，以确保在链接过程中能够区分同名的不同函数或变量，通常涉及添加额外的字符和编码信息。
C++ ABI	C++ ABI	即 C++ 应用程序二进制接口，它定义了编译器和链接器如何处理 C++ 代码，包括数据类型布局、对象模型、名称修饰、异常处理和内存管理等方面的规则。
目标代码	Object Code	目标代码指计算机科学中编译器或汇编器处理源代码后所生成的代码，它一般由机器代码或接近于机器语言的代码组成。

Github 上的 ICU

ICU 文档翻译

ICU

ICU4C

ICU4J

字符和字符串

转换

本地化和资源

日期或时间

格式化

数字格式化

日期和时间格式化

消息格式化

变换

词语定序

文本边界分析

输入输出

布局引擎

ICU 数据库

其他编程语言语言调用 ICU4C 的接口

设计文档

数据结构

贡献者

发行 & 里程碑

贡献者该如何配置

C++ 配置

Java 配置

源代码配置

术语表