ASCII
![]() ASCII コード biểuAnh:MIL-STD-188-100(1972) |
ASCII( アスキー,Anh:AmericanStandardCode forInformationInterchange) は, 1963 năm に chế định された,アメリカ hợp chúng quốcにおける tình báo thông tín dùng のVăn tự コードである. Nhật Bản ngữ 訳は “Tình báo trao đổi dùng Mễ quốc tiêu chuẩn コード[1]”となるが, giống nhau には nước Nhật nội でもASCIIと vật lưu niệm する. なおInternet Assigned Numbers Authority(IANA) はこれをASCIIではなくUS-ASCIIと vật lưu niệm する の が vọng ましいとしている[2].
Điểm chính[Biên tập]
1963 năm 6 nguyệt 17 ngày に, Mễ quốc quy cách hiệp hội ( American Standards Association: ASA, sau のANSI) によって chế định された. Lúc ấy の quy cách phiên hiệu は “ASA X3.4” であったが,Tình báo kỹ thuật quy cách quốc tế ủy ban(INCITS) の phát đủ に bạn い quy cách phiên hiệu が2002 năm に đặt lại され, hiện tại の quy cách phiên hiệu は “ANSI INCITS 4” である.
0 phiên から127 phiên まで の phiên hiệu ( số trị ) がど の văn tự や ký hiệu を ý vị するかという đối ứng quan hệ を định めている[3].
ASCIIは, あくまで1960 niên đại の アメリカにおいて tiếng Anh で の thông tín や lúc ấy の アメリカ の コンピュータに tất yếu な văn tự や ký hiệu などが hàm まれるように định めた văn tự コードである. そ の ため, hàm まれている の は thứ の ような văn tự や ký hiệu や chế ngự văn tự だけであり, それ bên ngoài は hàm まれていない.
- 《Tiếng Anhで sử われるアルファベット》 の đại văn tự と tiểu văn tự
- Tiếng Anh でよく sử われるƯớc vậtなど
- 0から9まで のCon số( アラビア con số )
- Chế ngự văn tự( ASCIIに hàm まれた chế ngự văn tự については#ASCII chế ngự văn tựの tiết で thuyết minh する )
これら の văn tự や ký hiệu をすべて thông し phiên hiệu で biểu hiện できるように, 7ビットを sử っている. つまり2 tiến sốで7 hằng, cụ thể には0000000から1111111まで, 10 tiến số でいえば0 phiên から127 phiên まで の phiên hiệu を sử い, それぞれ の số trị ( phiên hiệu ) に đối ứng する văn tự や ước vật や con số や chế ngự văn tự を quyết め, そ の đối ứng の quy tắc ( コード ) を chế định したも の である.
ASCII の cấu thành は thứ の ようになっている:
コード phạm 囲 ( 16 tiến ) | Nội dung |
---|---|
00–1F | Chế ngự văn tự |
20 | Chỗ trống |
21–7E | Đồ hình văn tự |
7F | Chế ngự văn tự (DEL) |
Đẻ ra quy cách[Biên tập]
ASCIIはISOTiêu chuẩn 7ビットVăn tự コードISO/IEC 646の nguyên となった. しかし7ビットでは tiếng Anh bên ngoài の ngôn ngữ に đối ứng するには không thập phần であり, sau に hắn の ヨーロッパ ngôn ngữ で sử われるラテン văn tự へ の đối ứng を thêm vào した8ビット văn tự コードであるISO/IEC 8859が sách định された. そ の sau, thế giới で sử dụng されている dạng 々な văn tự を biểu hiện できるようにするため, ASCIIで sử dụng されていない128 phiên lấy hàng の bộ phận に, そ の hắn の văn tự を cắt り đương てたり, số nhiều バイトを sử dụng して1つ の văn tự を biểu hiện したりするように một mình 拡 trương したVăn tự ký hiệu hóa phương thứcが sử われるようになっていった.
ASCII chế định lúc ấy, nhỏ nhất の データ処 lý 単 vị (メモリアドレッシングの nhỏ nhất 単 vị ) つまりバイトが6ビットであるコンピュータも nhiều かった (DECのPDPシリーズなど ). そ の ようなコンピュータでは6ビット の văn tự ký hiệu hóa phương thức を chọn dùng しており, そ の ためISO/IEC 646の sách định にあたっては, 7ビット ký hiệu hóa án の hắn に6ビット ký hiệu hóa án もあった. の ちに1バイトを8ビットとみなす, つまりオクテットを chọn dùng するコンピュータが người khí となり, chủ lưu となっていった[4].オクテットを chọn dùng したコンピュータでASCIIを tráp う trường hợp, 1ビット の dư りがある の で, そ の 8ビット mục は thông tín におけるエラーチェック dùng のパリティビットとして dùng いられていた[3].21 thế kỷ ngày đầu においても, trao đổi tính を duy trì する mục đích で, 7ビットコードが chính thức で, 8ビット mục は sử dụng できない quy cách がいくつか tồn tại する.
ASCIIから đẻ ra した một mình 拡 trương の văn tự ký hiệu hóa phương thức は1バイトコードおよび số nhiều バイトコードを hàm め đa số tồn tại するが, khắp nơi thức の gian に trao đổi tính はほとんどなく, quốc tế なデータ trao đổi tính に vấn đề があった. また, dị なる ngôn ngữ gian に hạn らず, lệ えば Nhật Bản ngữ の văn tự セットであっても số nhiều の ký hiệu hóa phương thức が tồn tại し, dị なるコンピュータ gian で trao đổi tính および nhưng dọn tính の ないCơ loại sống nhờ vào nhau văn tựが phát sinh することになった. そ の ため, thế giới の văn tự を単 một の コード hệ thống の もとに thâu lục する quốc tế な văn tự コード tiêu chuẩn として,ISO/IEC 10646およびUnicodeの sách định が tiến められることになった[5].Unicode phương thức で ký hiệu hóa された văn tự データ の うち, 0 phiên から127 phiên まではASCIIをベースにしており, trao đổi tính がある. Đặc に8ビット単 vị で ký hiệu hóa するUTF-8は, 128 phiên lấy hàng の văn tự を sử dụng しないデータ の trường hợp はASCIIと cùng の バイト liệt となる[6].従 tới の văn tự ký hiệu hóa phương thức では1バイトや2バイトで biểu hiện khả năng だった văn tự が, UTF-8では2バイトや3バイト trở lên tất yếu となってしまうケースもあるが, そ の デメリットを bổ ってなお dư りある trao đổi tính の cao さから quốc tế にもUTF-8 の phổ cập が tiến んでいる[7].これは従 tới の văn tự ký hiệu hóa phương thức が khai phát された lúc ấy と so べると, コンピュータ の メモリやストレージ の dung lượng が bay vọt に tăng đại しているためでもある.HTML5ではUTF-8 の sử dụng が đẩy thưởng されており[8],Sau 継 のHTML Living StandardでもデフォルトでUTF-8が sử dụng されることを tưởng định している[9].
ASCII chế ngự văn tự[Biên tập]
Sơ め の 32 văn tự ( 10 tiến số で0–31 ) はASCIIではChế ngự văn tựとして dư ước されている. Cơ bản にはこれら の chế ngự văn tự は tỏ vẻ するため の văn tự ではなく,モニタやプリンタなど の máy móc を chế ngự するために dùng いられる. Lệ えば,ASCII10 ( 10 tiến ) はline feed( đổi nghề ) を biểu しプリンタ の giấy đưa りなどに dùng いる,ASCII27 はエスケープを biểu す.
ASCII127 ( toàn て の ビットがオン, つまり, 2 tiến số で1111111 ) は,delete(Trừ bỏ văn tự) として biết られる chế ngự văn tự である. こ の ký hiệu が hiện れた trường hợp, そ の bộ phận の データが đánh tan されていることを kỳ す. こ の chế ngự văn tự だけ lúc đầu bộ phận になく cuối cùng にある lý do は,パンチテープへ の nhớ lục は thượng thư きが ra tới ないため, trừ bỏ する tế には toàn てに huyệt を không けることで đối ứng できるというところからきている ( 1111111は toàn てに huyệt の khai いた trạng thái を kỳ す ). また,ASCII0 ( toàn て の ビットがオフ, つまり2 tiến số で0000000 ) はNullあるいはヌル văn tựと hô ばれ,deleteと cùng dạng に nhiều く の コンピュータシステムでは làm lơ される. これは, 仮にパンチテープと phản đối に1を0に変えることでデータを nhớ lục し, かつ thượng thư きが không có khả năng な truyền thông が tồn tại する trường hợp でも đối ứng できるようにしている の である.
コード の nhiều くは, データ転 đưa プロトコルで dùng いられる. ( lệ: ヘッディング bắt đầu, テキスト bắt đầu, テキスト kết thúc など )
セパレータはTừ khí テープへ の bảo tồn の ために thiết kế された.
XONやXOFFは, プリンタ の ような処 lý の trì いデバイスにおいて, データを thất うことがないように tình báo の lưu れを chế ngự するために dùng いることがある.
2 tiến | 8 tiến | 10 tiến | 16 tiến | Lược ngữ | Đồ hình biểu hiện | CS | エスケープシーケンス | Danh trước / ý vị |
---|---|---|---|---|---|---|---|---|
000 0000 | 000 | 0 | 00 | NUL | ␀ | ^@ | \0 | ヌル văn tự |
000 0001 | 001 | 1 | 01 | SOH | ␁ | ^A | ヘッディング bắt đầu | |
000 0010 | 002 | 2 | 02 | STX | ␂ | ^B | テキスト bắt đầu | |
000 0011 | 003 | 3 | 03 | ETX | ␃ | ^C | テキスト kết thúc | |
000 0100 | 004 | 4 | 04 | EOT | ␄ | ^D | Vân tống chung | |
000 0101 | 005 | 5 | 05 | ENQ | ␅ | ^E | Hỏi い hợp わせ | |
000 0110 | 006 | 6 | 06 | ACK | ␆ | ^F | Khẳng định ứng đáp | |
000 0111 | 007 | 7 | 07 | BEL | ␇ | ^G | \a | ベル |
000 1000 | 010 | 8 | 08 | BS | ␈ | ^H | \b | Lui về phía sau |
000 1001 | 011 | 9 | 09 | HT | ␉ | ^I | \t | Trình độ タブ |
000 1010 | 012 | 10 | 0A | LF | ␊ | ^J | \n | Đổi nghề |
000 1011 | 013 | 11 | 0B | VT | ␋ | ^K | \v | Vuông góc タブ |
000 1100 | 014 | 12 | 0C | FF | ␌ | ^L | \f | Thư thức đưa り |
000 1101 | 015 | 13 | 0D | CR | ␍ | ^M | \r | Phục quy |
000 1110 | 016 | 14 | 0E | SO | ␎ | ^N | シフトアウト | |
000 1111 | 017 | 15 | 0F | SI | ␏ | ^O | シフトイン | |
001 0000 | 020 | 16 | 10 | DLE | ␐ | ^P | Vân đưa chế ngự 拡 trương | |
001 0001 | 021 | 17 | 11 | DC1 | ␑ | ^Q | Trang bị chế ngự 1,XON | |
001 0010 | 022 | 18 | 12 | DC2 | ␒ | ^R | Trang bị chế ngự 2 | |
001 0011 | 023 | 19 | 13 | DC3 | ␓ | ^S | Trang bị chế ngự 3,XOFF | |
001 0100 | 024 | 20 | 14 | DC4 | ␔ | ^T | Trang bị chế ngự 4 | |
001 0101 | 025 | 21 | 15 | NAK | ␕ | ^U | Phủ định ứng đáp | |
001 0110 | 026 | 22 | 16 | SYN | ␖ | ^V | Đồng kỳ tín hiệu | |
001 0111 | 027 | 23 | 17 | ETB | ␗ | ^W | Vân đưa ブロック chung kết | |
001 1000 | 030 | 24 | 18 | CAN | ␘ | ^X | Hủy bỏ | |
001 1001 | 031 | 25 | 19 | EM | ␙ | ^Y | Truyền thông đầu cuối | |
001 1010 | 032 | 26 | 1A | SUB | ␚ | ^Z | Đổi thành | |
001 1011 | 033 | 27 | 1B | ESC | ␛ | ^[ | \e | エスケープ |
001 1100 | 034 | 28 | 1C | FS | ␜ | ^\ | ファイル chia lìa đánh dấu | |
001 1101 | 035 | 29 | 1D | GS | ␝ | ^] | グループ chia lìa đánh dấu | |
001 1110 | 036 | 30 | 1E | RS | ␞ | ^^ | レコード chia lìa đánh dấu | |
001 1111 | 037 | 31 | 1F | US | ␟ | ^_ | ユニット chia lìa đánh dấu | |
111 1111 | 177 | 127 | 7F | DEL | ␡ | ^? | Mạt tiêu |
ASCII ấn tự khả năng văn tự[Biên tập]
ASCII 32は, chỗ trống văn tự である. キーボード の スペースキーから nhập lực でき, ngữ と ngữ の gian に chỗ trống を tỏ vẻ する. ASCII 33–126は in ấn khả năng な văn tự (printable characters) であり, nửa giác anh số の con số, câu đọc điểm や ký hiệu を biểu す. Nếu い thuận からエクスクラメーションマーク,ダブルクオーテーション,…と続き, ラテン văn tự đại văn tự の trước に con số と hơn phân nửa の nửa giácƯớc vật,Đại văn tự と tiểu văn tự の gian, ラテン văn tự tiểu văn tự の sau にも nhiều loại loại の nửa giác ước vật が cắt り đương てられている.
Hạ の đồ では, 16 tiến số ・10 tiến số ・8 tiến số の thuận でASCIIコード の trị を kỳ す.
Phàm lệ:
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
_ | 2 SP 20(16) 32(10) 40(8) |
! 21(16) 33(10) 41(8) |
" 22(16) 34(10) 42(8) |
# 23(16) 35(10) 43(8) |
$ 24(16) 36(10) 44(8) |
% 25(16) 37(10) 45(8) |
& 26(16) 38(10) 46(8) |
' 27(16) 39(10) 47(8) |
( 28(16) 40(10) 50(8) |
) 29(16) 41(10) 51(8) |
* 2a(16) 42(10) 52(8) |
+ 2b(16) 43(10) 53(8) |
, 2c(16) 44(10) 54(8) |
- 2d(16) 45(10) 55(8) |
. 2e(16) 46(10) 56(8) |
/ 2f(16) 47(10) 57(8) |
_ | 30 30(16) 48(10) 60(8) |
1 31(16) 49(10) 61(8) |
2 32(16) 50(10) 62(8) |
3 33(16) 51(10) 63(8) |
4 34(16) 52(10) 64(8) |
5 35(16) 53(10) 65(8) |
6 36(16) 54(10) 66(8) |
7 37(16) 55(10) 67(8) |
8 38(16) 56(10) 70(8) |
9 39(16) 57(10) 71(8) |
: 3a(16) 58(10) 72(8) |
; 3b(16) 59(10) 73(8) |
< 3c(16) 60(10) 74(8) |
= 3d(16) 61(10) 75(8) |
> 3e(16) 62(10) 76(8) |
? 3f(16) 63(10) 77(8) |
_ | 4@ 40(16) 64(10) 100(8) |
A 41(16) 65(10) 101(8) |
B 42(16) 66(10) 102(8) |
C 43(16) 67(10) 103(8) |
D 44(16) 68(10) 104(8) |
E 45(16) 69(10) 105(8) |
F 46(16) 70(10) 106(8) |
G 47(16) 71(10) 107(8) |
H 48(16) 72(10) 110(8) |
I 49(16) 73(10) 111(8) |
J 4a(16) 74(10) 112(8) |
K 4b(16) 75(10) 113(8) |
L 4c(16) 76(10) 114(8) |
M 4d(16) 77(10) 115(8) |
N 4e(16) 78(10) 116(8) |
O 4f(16) 79(10) 117(8) |
_ | 5P 50(16) 80(10) 120(8) |
Q 51(16) 81(10) 121(8) |
R 52(16) 82(10) 122(8) |
S 53(16) 83(10) 123(8) |
T 54(16) 84(10) 124(8) |
U 55(16) 85(10) 125(8) |
V 56(16) 86(10) 126(8) |
W 57(16) 87(10) 127(8) |
X 58(16) 88(10) 130(8) |
Y 59(16) 89(10) 131(8) |
Z 5a(16) 90(10) 132(8) |
[ 5b(16) 91(10) 133(8) |
\ 5c(16) 92(10) 134(8) |
] 5d(16) 93(10) 135(8) |
^ 5e(16) 94(10) 136(8) |
_ 5f(16) 95(10) 137(8) |
_ | 6` 60(16) 96(10) 140(8) |
a 61(16) 97(10) 141(8) |
b 62(16) 98(10) 142(8) |
c 63(16) 99(10) 143(8) |
d 64(16) 100(10) 144(8) |
e 65(16) 101(10) 145(8) |
f 66(16) 102(10) 146(8) |
g 67(16) 103(10) 147(8) |
h 68(16) 104(10) 150(8) |
i 69(16) 105(10) 151(8) |
j 6a(16) 106(10) 152(8) |
k 6b(16) 107(10) 153(8) |
l 6c(16) 108(10) 154(8) |
m 6d(16) 109(10) 155(8) |
n 6e(16) 110(10) 156(8) |
o 6f(16) 111(10) 157(8) |
_ | 7p 70(16) 112(10) 160(8) |
q 71(16) 113(10) 161(8) |
r 72(16) 114(10) 162(8) |
s 73(16) 115(10) 163(8) |
t 74(16) 116(10) 164(8) |
u 75(16) 117(10) 165(8) |
v 76(16) 118(10) 166(8) |
w 77(16) 119(10) 167(8) |
x 78(16) 120(10) 170(8) |
y 79(16) 121(10) 171(8) |
z 7a(16) 122(10) 172(8) |
{ 7b(16) 123(10) 173(8) |
| 7c(16) 124(10) 174(8) |
} 7d(16) 125(10) 175(8) |
~ 7e(16) 126(10) 176(8) |
|
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F |
Đại văn tự の ASCII trị に32を thêm えると tiểu văn tự に変 đổi することができる. こ の 変 đổi は, 2 tiến pháp では, 6ビット mục に1をセットするだけでよい. また, con số から48を giảm じれば, đối ứng する trị が đến られる. こ の 変 đổi は, 5ビット mục cập び6ビット mục に0をセットするか, あるいは単 thuần に thượng vị 4ビットを làm lơ するだけでもよい. なお, ấn tự khả năng văn tự の うち “@” から thủy まる32 văn tự については, ASCII trị を64 giảm じて đối ứng する chế ngự văn tự を cầu め, こ の chế ngự văn tự を “コントロール+” (Anh:control+) という trước trí biểu hiện を phó けた ấn tự khả năng văn tự で vật lưu niệm する thói quen がある.
Lệ: BELコード(07) → “コントロール+G” ( chịu tin した sườn の máy móc で chú ý kêu lên âm が minh る )
こ の chế ngự văn tự の vật lưu niệm phương pháp は, キーボード thượng の ấn tự khả năng văn tự キーを chế ngự văn tự の đưa ra に dùng いていた máy móc の danh tàn りであると khảo えられる ( 7ビット mục を0にセットする chuyên dùng キー (Ctrlキー) を, ấn tự khả năng văn tự キーと đồng thời に áp して chế ngự văn tự を đưa ra ).
また, Unix đoan mạt ではCtrl+Con sốによって, nhân gian công học に áp hạ しづらい chế ngự văn tự を đưa ra できる.キャレット nhớ phápを dùng いると, cụ thể には dưới であることが nhiều い.[Muốn xuất xứ]
- Ctrl+2が
^@
- Ctrl+3が
^[
- Ctrl+4が
^\
- Ctrl+5が
^]
- Ctrl+6が
^^
- Ctrl+7が
^_
- Ctrl+8が
^?
Thiếu điểm など[Biên tập]
Kể trên されているようにASCIIは Mễ quốc の quy cách であり, ラテン văn tự を dùng いる ngôn ngữ であっても tiếng Anh bên ngoài を vật lưu niệm するには không thập phần である.
Lúc trướcサーカムフレックス,チルダ,グレイヴ・アクセントおよび ( vốn dĩ の mục đích と kiêm dùng で )アポストロフィー,コーテーションマーク,コンマは hắn の văn tự に thêm vào するダイアクリティカルマークとしてChạy bằng điện タイプライターで trọng ね đánh ちすることを tưởng định していたが[10],Gian にバックスペースを nhập lực しなければならず,ビデオ tỏ vẻ đoan mạtでは trọng ね đánh ちが sự thật thượng không có khả năng であるなど の lý do で phổ cập しなかった.
Lúc đầu に trao đổi tính の ない変 loại が các quốc gia で xuất hiện したため,ISO/IEC 646では trí き đổi え khả năng な văn tự を định nghĩa することで đối ứng を đồ ったが, trí き đổi えられた văn tự を lợi dụng するプログラム ngôn ngữや dị なる văn tự tập hợp の gian ではVăn tự hóa けが phát sinh することとなった. ( Nhật Bản ngữ ではJIS X 0201に nguyên nhân gây ra するバックスラッシュのYên ký hiệuへ の văn tự hóa けがある. )
1970 niên đại lấy hàng, 8ビットがコンピュータで chủ lưu のバイトサイズになると, thêm vào の 1ビット の lĩnh vực を lợi dụng したいわゆる拡 trương ASCIIが ngôn ngữ ・ cơ loại ごとに loạn lập した.ISO/IEC 8859ではこれら の thêm vào lĩnh vực を chuẩn hoá し,スペイン ngữ,ポルトガル ngữ,フランス ngữ,ドイツ ngữChờ で dùng いられるラテン văn tự の ほとんどがISO/IEC 8859-1に thống hợp された.
ISO/IEC 2022では Nhật Bản ngữ (ISO-2022-JP) を hàm む số nhiều の văn tự tập hợp を ký hiệu biểu の thiết り thế えによって thống nhất したが, biểu の thiết り thế えを dùng いた phương pháp は chế ngự が phục tạp であるなど の thiếu điểm もあり, 2023 năm hiện tại では toàn て の văn tự を thống nhất された ký hiệu で tráp えるUnicodeが chủ lưu となっている.
Chú thích[Biên tập]
Xuất xứ[Biên tập]
- ^“Tình báo trao đổi dùng Mễ quốc tiêu chuẩn コード”.ibm( 2014 năm 2 nguyệt 20 ngày ).2022 năm 6 nguyệt 29 ngàyDuyệt lãm.
- ^“Character Sets”.Internet Assigned Numbers Authority (IANA) (2022 năm 7 nguyệt 14 ngày ).2023 năm 2 nguyệt 19 ngàyDuyệt lãm.
- ^abASCII ( アスキー / US-ASCII ) とは - ý vị をわかりやすく - IT dùng từ từ điển e-Words
- ^“オクテット” と “バイト” は gì が vi う? | ngày kinh クロステック ( xTECH )
- ^Unicode ( ユニコード ) とは - ý vị をわかりやすく - IT dùng từ từ điển e-Words
- ^UTF-8とは - ý vị をわかりやすく - IT dùng từ từ điển e-Words
- ^Webサイト の văn tự コーディング, 90%がUTF-8 lợi dụng - Shift JISは0.9% | TECH+ ( テックプラス )
- ^HTMLで văn tự エンコーディングを chỉ định する
- ^HTML Standard - §4.2.5.4 Specifying the document's character encoding
- ^"Character histories: notes on some ASCII code positions"
Tham khảo văn hiến[Biên tập]
- “ANSI INCITS 4-1986 (formerly ANSI X3.4-1986) American National Standard for Information Systems ― Coded Character Sets ― 7-Bit American National Standard Code for Information Interchange (7-Bit ASCII)”American National Standards Institute( 1963 năm 6 nguyệt 17 ngày chế định, 1986 năm 3 nguyệt 26 ngày cuối cùng sửa lại, 2002 năm 1 nguyệt 15 ngày quy cách phiên hiệu 変 càng )