トップ 一覧 検索 ヘルプ RSS ログイン

検索

キーワード AND OR
  • ASCII - 日本の1バイトコードJIS X 0201のラテン文字集合はASCIIと類似しています。2文字だけ違います。
  • BMP - BMPには、ラテン文字、ギリシャ文字、キリル文字のようなアルファベットから、平仮名・片仮名、漢字、ハングルのような東アジアの文字、アラビア文字、インド系文字など、世界の主要な文字が収録されています。
  • GB 2312 - 日本のJIS X 0208に類似した2バイトコードです。漢字(簡体字)のほか、ラテン文字、ギリシャ文字、キリル文字、平仮名、片仮名、数字、記号などを含みます。
  • ISO-2022-JP - なお、ASCIIのかわりにJIS X 0201ラテン文字集合(1b 28 4a)、
  • ISO/IEC 2022 - また、JIS X 0213の規格本体で定める6種類の符号化は、漢字集合1面・漢字集合2面・[[ISO/IEC 646]]国際基準版(ASCIIと同等)、JIS X 0201ラテン文字という複数の符号化文字集合を
  • ISO/IEC 646 - * JIS X 0201ラテン文字集合はISO/IEC 646の枠組みに則って定義されています。
  • ISO/IEC 8859 - * GR領域(0xA0-0xFF)には、ASCIIにないラテン文字やギリシャ文字、キリル文字などの集合を配置します
  • ISO/IEC 8859-1 - ISO/IEC 8859-1は、ISOとIECによる文字コードの国際規格で、西ヨーロッパの諸言語の表記に使われるラテン文字を符号化するものです。[[ISO/IEC 8859]]という規格の第1部です。通称としてLatin-1ともいいます。最新版は1998年に発行されています。
  • ISO/IEC 8859-2 - ASCIIには入っていない、アクセントやウムラウト、オゴネク、キャロンなどのダイアクリティカルマーク付きのラテン文字が収められています。
  • JIS X 0201 - ラテン文字集合、片仮名集合という2つの符号化文字集合を定義しています。
  • JIS X 0208 - 漢字をはじめ、平仮名、片仮名、ラテン文字、ギリシャ文字、キリル文字、数字、記号類を含む6,879文字のコードを定めています。
  • JIS X 0212 - JIS X 0208に含まれない漢字、アクセントつきラテン文字・ギリシャ文字、記号類等の集合を定め、それぞれの文字に符号化表現を与えています。
  • JIS X 0213 - このうち漢字集合1面がJIS X 0208の上位互換です。平仮名・片仮名やダイアクリティカルマーク付きラテン文字、丸付き数字や記号類といった非漢字、それに比較的使用頻度の高い第3水準漢字が追加されています。
  • KS X 1001 - 日本のJIS X 0208に類似した2バイトコードです。ハングル、漢字のほか、ラテン文字、ギリシャ文字、キリル文字、平仮名、片仮名、数字、記号などを含みます。
  • Shift_JIS - JIS X 0201の8ビットコードは、0x7F以下(GL領域)にラテン文字集合(ASCIIと類似、2文字だけ違う)を、0xA0以上(GR領域)に片仮名集合の、ともに1バイトコードを配置しています。しかし片仮名集合は0xE0以降が空いているので、そこと0x80-0x9Fの制御文字領域をも利用して、JIS X 0208の文字を詰め込んでしまったものがShift_JISです。
  • Shift_JIS-2004 - 1バイトコードの範囲は、0x00-0x7F (JIS X 0201ラテン文字集合)、0xA0-0xDF (JIS X 0201片仮名集合)です。
  • アイヌ語 - また、アイヌ語のテキストには記号としてハイフンを上下に2つ並べた格好のダブルハイフンが用いられることがあります。アイヌ語専用ではなく汎用的に用いられる記号です。アイヌ語の片仮名でなくラテン文字表記のテキストにもこの記号は用いられることがあります。
  • エスケープシーケンス - ,JIS X 0201ラテン文字集合,1B 28 4A,ESC ( J
  • キリル文字 - ラテン文字と同じようにギリシャ文字にルーツを持ちます。
  • ギリシャ文字 - ラテン文字の元になっており、両者には形の共通する文字もあります。例えば、ギリシャ文字のアルファの大文字(Α)は、ラテン文字の対応する「A」(エー)と同じ形です。ただし文字コードでは、形の区別が困難であっても、ラテン文字とギリシャ文字という異なる文字体系(用字系, script)ではそれぞれに独立した符号位置を与えるのが普通です。
  • ダイアクリティカルマーク - ダイアクリティカルマークとは、文字につける補助的な符号です。ドイツ語でaやoなどの上につけられるウムラウト記号(¨)や、フランス語でeなどの上につけられるアキュートアクセント(´)、スペイン語やポルトガル語で用いられるチルダ(~)などが該当します。平仮名や片仮名の濁点・半濁点も一種のダイアクリティカルマークといえます。以下ではもっぱらラテン文字におけるダイアクリティカルマークについて述べます。
  • チルダ - チルダ (チルドとも。tilde) とは、ラテン文字の上につくダイアクリティカルマークの一種です。横線が波打った形をしています。
  • ハイフンマイナス - JIS X 0201のラテン文字集合にはASCIIと同じく2/13にハイフンマイナスがあります。
  • ラテン文字 - ラテン文字
  • ローマ字 - * ラテン語や英語等の表記に用いられるアルファベット。「ラテン文字」と同じ
  • 円記号 - JIS X 0201のラテン文字集合の符号位置5/12 (16進で0x5C)に円記号があります。
  • 外字 - 例えば、UTF-8とSJISの間でコード変換をするときには、JIS X 0208ベースのShift_JISでなく、拡張規格のJIS X 0213ベースのShift_JIS-2004を指定すれば、丸付き数字やローマ数字はもちろん、専門用語や地名などに使われる第3第4水準漢字や、アクセント付きのラテン文字、英和辞典に用いられる発音記号、著作権表示記号など各種記号類も文字化けせずに使用できます。iconvコマンドでコード変換するときはこうします:
  • 漢字集合1面 - **アクセント記号などダイアクリティカルマーク付きのラテン文字。フランス語やドイツ語等欧州言語で使われるものや、日本語のローマ字表記で長音を表すものなど。特に、西欧の[[ISO/IEC 8859-1]]、中欧の[[ISO/IEC 8859-2]]の文字は全て含む
  • 合字 - !!ラテン文字における合字
  • 代替名称 - 例えば、国際基準版・漢字用8ビット符号のように、JIS X 0208と[[ISO/IEC 646]]国際基準版とともに用いる場合、ラテン文字や数字等が両方に存在します。このようなとき、重複符号化を避けるため、どちらか片方 ([[ISO/IEC 2022]]にのっとる場合、指示されるG番号の小さい方) のみを使用することになります。ただし、慣用的に「全角・半角」として異なる文字であるかのように使われてきた経緯があるため、「これまでの慣用的な利用との互換を目的としてだけ,附属書5表2に規定する文字をISO/IEC 646で規定される文字とは異なった図形文字として用いてもよい」(JIS X 0208:1997 7.2節)とされています。この附属書5「文字の代替名称」には、このような目的に使用できる代替名称が決められています。
  • 波ダッシュ問題 - これにより、正しいUnicode符号位置へ変換されます。この指定は、波ダッシュ問題を避けるだけでなく、丸つき数字やローマ数字等の救済にも効果があり、また第3第4水準漢字やアクセントつきラテン文字などといった日本で使用されている各種の文字への対応という点からも望まれます。
  • 非漢字 - 主な非漢字としては、平仮名、片仮名、ラテン文字、ギリシャ文字、キリル文字、算用数字、それに句読点や数学記号等の記号類があります。
  • 文字名 - 例えば、ラテン文字の大文字A (U+0041)に対しては、「LATIN CAPITAL LETTER A」という名前が付けられています。平仮名の「あ」(U+3042)は「HIRAGANA LETTER A」です。