UTF-8

出自福留子孫
在2023年6月24日 (六) 21:21由丁志仁對話 | 貢獻所做的修訂版本

跳轉到: 導覽搜尋

UTF-8編碼位元組含義:

  • ◽◾◾◾◾◾◾◾,對於UTF-8編碼中的任意位元組B,如果B的第一位為0,則B獨立的表示一個字元(ASCII碼);
  • ◾◽??????,128~191,如果B的第一位為1,第二位為0,則B為一個多位元組字元中的一個位元組(非ASCII字元);
識別位元固定為 128 ,表值 0~63。
  • ◾◾◽?????,192~223,如果B的前兩位為1,第三位為0,則B為兩個位元組表示的字元中的第一個位元組;
識別位元固定為 192 ,(0~31)×64。
  • ◾◾◾◽????,224~239,如果B的前三位為1,第四位為0,則B為三個位元組表示的字元中的第一個位元組;
  • ◾◾◾◾◽???,240~247,如果B的前四位為1,第五位為0,則B為四個位元組表示的字元中的第一個位元組;

組成字(以「瓦」的中文 3 byte 為例):

  1. 第一 byte 231, 231-224=7 ,單位 4096
  2. 第二 byte 147, 147-128=19 ,單位 64
  3. 第三 byte 166, 166-128=38 ,單位 1
字碼 = 7×4096+19×64+38=29926 ,字碼寫成 瓦

0~127

0~31 控制字元

DEC OCT HEX BIN Symbol HTML Number HTML Name Description
<a href='/0' title='ASCII Code 0'>0</a>0000000000000NUL&#00; Null character
<a href='/1' title='ASCII Code 1'>1</a>0010100000001SOH&#01; Start of Heading
<a href='/2' title='ASCII Code 2'>2</a>0020200000010STX&#02; Start of Text
<a href='/3' title='ASCII Code 3'>3</a>0030300000011ETX&#03; End of Text
<a href='/4' title='ASCII Code 4'>4</a>0040400000100EOT&#04; End of Transmission
<a href='/5' title='ASCII Code 5'>5</a>0050500000101ENQ&#05; Enquiry
<a href='/6' title='ASCII Code 6'>6</a>0060600000110ACK&#06; Acknowledge
<a href='/7' title='ASCII Code 7'>7</a>0070700000111BEL&#07; Bell, Alert
<a href='/8' title='ASCII Code 8'>8</a>0100800001000BS&#08; Backspace
<a href='/9' title='ASCII Code 9'>9</a>0110900001001HT&#09; Horizontal Tab
<a href='/10' title='ASCII Code 10'>10</a>0120A00001010LF&#10; Line Feed
<a href='/11' title='ASCII Code 11'>11</a>0130B00001011VT&#11; Vertical Tabulation
<a href='/12' title='ASCII Code 12'>12</a>0140C00001100FF&#12; Form Feed
<a href='/13' title='ASCII Code 13'>13</a>0150D00001101CR&#13; Carriage Return
<a href='/14' title='ASCII Code 14'>14</a>0160E00001110SO&#14; Shift Out
<a href='/15' title='ASCII Code 15'>15</a>0170F00001111SI&#15; Shift In
<a href='/16' title='ASCII Code 16'>16</a>0201000010000DLE&#16; Data Link Escape
<a href='/17' title='ASCII Code 17'>17</a>0211100010001DC1&#17; Device Control One (XON)
<a href='/18' title='ASCII Code 18'>18</a>0221200010010DC2&#18; Device Control Two
<a href='/19' title='ASCII Code 19'>19</a>0231300010011DC3&#19; Device Control Three (XOFF)
<a href='/20' title='ASCII Code 20'>20</a>0241400010100DC4&#20; Device Control Four
<a href='/21' title='ASCII Code 21'>21</a>0251500010101NAK&#21; Negative Acknowledge
<a href='/22' title='ASCII Code 22'>22</a>0261600010110SYN&#22; Synchronous Idle
<a href='/23' title='ASCII Code 23'>23</a>0271700010111ETB&#23; End of Transmission Block
<a href='/24' title='ASCII Code 24'>24</a>0301800011000CAN&#24; Cancel
<a href='/25' title='ASCII Code 25'>25</a>0311900011001EM&#25; End of medium
<a href='/26' title='ASCII Code 26'>26</a>0321A00011010SUB&#26; Substitute
<a href='/27' title='ASCII Code 27'>27</a>0331B00011011ESC&#27; Escape
<a href='/28' title='ASCII Code 28'>28</a>0341C00011100FS&#28; File Separator
<a href='/29' title='ASCII Code 29'>29</a>0351D00011101GS&#29; Group Separator
<a href='/30' title='ASCII Code 30'>30</a>0361E00011110RS&#30; Record Separator
<a href='/31' title='ASCII Code 31'>31</a>0371F00011111US&#31; Unit Separator

32~31 控制字元

===等價===: 「◾◽??????」與「◽◽??????」皆合法且等價

  1. https://graphemica.com/%C2%A1
  2. https://www.ascii-code.com/
  3. http://jendo.org/study/showChar.html
  4. http://jendo.org/study/seeDecode.php