Unicode符號是什麼意思

Unicode 是一種國際標準,用於編碼世界上所有的字元(包括字母、數字、標點符號、標誌、圖形符號等),以便它們可以在不同的計算機系統和不同的語言之間進行交流。Unicode 字元集包含了超過 143,000 個字元,這些字元來自世界上幾乎所有的書寫系統,包括拉丁文、希臘文、西里爾文、阿拉伯文、希伯來文、漢字、日文、韓文等。

Unicode 字元由一個編碼點(code point)表示,編碼點是一個數字,後面跟隨著一個字母 U,用來表示該字元在 Unicode 字元集中的位置。例如,拉丁字母 A 的編碼點是 U+0041,而漢字 "中" 的編碼點是 U+4E2D。

Unicode 字元可以分為幾個平面(plane),每個平面包含 65,536 個字元。基本多文種平面(Basic Multilingual Plane, BMP)是第一個平面,也是最常用的平面,包含了大多數的常用字元。其他平面用於較不常用的字元,如表情符號、象形文字、非拉丁字母等。

Unicode 字元的編碼點可以用 U+ 加上四位數或更多位數的十六進制數表示。例如,U+0000 到 U+FFFF 屬於基本多文種平面,而 U+10000 到 U+1FFFF 屬於第一個輔助平面,以此類推。

Unicode 字元的實際表示形式可以是 UTF-8、UTF-16 或 UTF-32,這取決於所使用的應用程式和系統。UTF-8 是目前最常用的編碼形式,因為它可以在任何編碼長度的字節序列中表示任何 Unicode 字元,並且在處理拉丁文和西里爾文等簡單的字母表時效率很高。