1. カメラ
  2. カーオーディオ&エレクトロニクス
  3. ホームオーディオ
  4. パーソナルオーディオ
  5. テレビ
  6. スマートホーム
  >> 電子技術オンライン >  >> スマートホーム >> スマートライフ

UTF 7 と UTF 8

UTF-7 と UTF-8 はどちらも Unicode Transformation Format の一種で、国際文字や特殊記号などの 16 ビット Unicode 文字を 7 ビットまたは 8 ビット システムで送信できる形式にエンコードするために使用される標準です。 UTF-8 は最も一般的に使用されているエンコード形式で、Web ページや多くの電子メール プログラムでよく使われています。 UTF-7 は、UTF-8 では機能しない一部の電子メール プロトコルのエンコードを提供します。

ユニコード

Unicode は、文字を整数として表現するための国際標準です。情報交換用の米国標準コードである ASCII で使用される 7 ビットに対して、1 文字あたり 16 ビットを使用します。 Unicode で使用できる 65,000 の一意の文字に対して、ASCII は 128 文字しか再現できません。このように文字の範囲が広いため、Unicode は東アジア言語や大きな文字セットを持つその他の言語により適していますが、Unicode 文字を 7 ビットまたは 8 ビットのビット チャネル経由で送信する場合は、エンコードする必要があります。

UTF-8

UTF-8 は、Unicode 文字を 8 ビット セグメントに変換するために使用される最も一般的な Universal Transformation Format であり、電子メールやその他の 8 ビット チャネルを介して Web 経由で転送されます。このコーディング形式は、Unicode 文字の整数値に応じて、各 Unicode 文字を 1 ~ 4 オクテットに変更します。これは、ASCII 文字セットにもある文字を主に使用するドキュメントにとって非常に効率的です。 UTF-8 は、非西洋アルファベットのシングルバイト エンコーディングよりも多くのスペースを占有する傾向があります。

UTF-7

UTF-7 は、1990 年代半ばに最初に提案された Universal Transformation Format の特別な変形です。 Unicode テキストを ASCII 文字の文字列で表すように設計されており、UTF-8 よりも効率的な電子メールのエンコード方法と、7 ビットのデータ パスを介して送信するために必要な引用印刷可能なエンコードを生成します。 UTF-7 エンコードを使用すると、エンコードされた文字のサイズが大幅に縮小されます。

考慮事項

UTF-7 は UTF-8 に quoted-printable を加えたものよりも 7 ビット チャネルで効率的ですが、Internet Mail Consortium や Microsoft Developer Network を含むほとんどの機関は、可能な限り UTF-7 ではなく UTF-8 を使用することを推奨しています。これは、UTF-7 が、その 8 ビット相対には存在しないセキュリティと堅牢性の問題を引き起こすためです。 IMC はまた、1999 年 1 月 1 日以降に作成されたすべてのメール表示プログラムが UTF-8 でメールを表示できるようにすることを推奨しています。