Unicode什麼意思

Unicode 是一個國際標準,用於編碼世界上各種書寫系統的字元。它的目標是提供一個涵蓋所有語言的字元集,以便於在不同的計算機系統和平台上進行文本交換和處理。Unicode 字元集包含了超過 143,000 個字元,包括拉丁字母、希臘字母、斯拉夫字母、阿拉伯字母、希伯來字母、漢字、日文假名、朝鮮文字、泰文字母等。

Unicode 不僅包括了字母和數字,還包括了標點符號、標誌、表情符號、技術符號、歷史符號等。每個字元在 Unicode 字元集中都被賦予了一個唯一的編碼,稱為 Unicode 碼點。碼點是一個 16 位或 32 位的數字,用來識別特定的字元。

Unicode 碼點的範圍從 U+0000 到 U+10FFFF,其中 U+ 表示 Unicode 碼點的前綴,後面的數字表示碼點的值。例如,拉丁字母 A 的碼點是 U+0041,漢字 "中" 的碼點是 U+4E2D。

Unicode 碼點可以通過幾種不同的編碼格式進行編碼和傳輸,包括 UTF-8、UTF-16 和 UTF-32。這些編碼格式將碼點轉換為一個或幾個字節的序列,以便於在計算機網絡上進行傳輸和存儲。

Unicode 標準由 Unicode 聯盟(The Unicode Consortium)負責制定和維護。該聯盟是一個非營利組織,由多家技術公司和組織組成,包括 Apple、Google、Microsoft、Adobe、IBM 等。Unicode 標準的最新版本是 Unicode 14.0,於 2021 年 9 月發布。