サニタイズとは?【IT用語】

この記事では『サニタイズ』について、

  • サニタイズとは
  • サニタイズの具体例

などを図を用いて分かりやすく説明するように心掛けています。ご参考になれば幸いです。

サニタイズとは

サニタイズとは

サニタイズは、主にIT分野で使われる用語で、ユーザーが入力したデータの中に含まれる「特別な意味を持つ文字(例えば、< や >)」を一定の規則に従って別の表記に置き換えて無効化することを指します。

Webアプリケーションでは、ユーザー入力を処理する際、サニタイズは重要なセキュリティ対策として実施されます。特に、クロスサイトスクリプティング(XSS)攻撃を防ぐために不可欠です。

補足

  • サニタイズ処理を行うことをサニタイジングと呼びます
  • サニタイズは英語では「sanitize」と書きます。「消毒する」「浄化する」という意味があり、データを安全な状態に浄化するイメージです。

サニタイズの具体例

Webアプリケーションでは、特殊な文字や記号が重要な役割を持ちます。たとえば、HTMLでは<>が特別な意味を持ち、HTMLタグとして解釈されます。例えば、<br>は改行を示し、<script>はJavaScriptのコードを埋め込むためのタグです。

まず、サニタイズをしない場合について説明します。

サニタイズをしない場合

例えば、次のようなデータが入力フォームに入力されたとしましょう。

こんにちは!<script>alert('あなたのデータは危険です!');</script>

このデータをサニタイズせずに画面に表示すると、ブラウザは次のように解釈します(例:<p>タグ内で表示)。

<p>こんにちは!<script>alert('あなたのデータは危険です!');</script></p>

この場合、ブラウザは<script>タグの前の「こんにちは!」というテキストを表示しますが、<script>タグ内のJavaScriptコードが実行され、次のようなアラートメッセージが表示されます。

あなたのデータは危険です!

このように、WebアプリケーションのフォームにHTMLタグやJavaScriptを埋め込み、不正なスクリプトを実行させる攻撃がクロスサイトスクリプティング(XSS)です。

サニタイズをする場合

では、<script>タグをそのままテキストとして表示するにはどうすれば良いでしょうか?そのままでは、ブラウザは<>をHTMLタグとして解釈してしまいます。これを防ぐために、サニタイズが必要です。

サニタイズを行うことで、<>といった特殊な文字を無害な形に変換します。具体的には、次のように変換します。

  • <&lt;
  • >&gt;

入力フォームに入力されたデータをサニタイズすると、次のようになります。

こんにちは!<script>alert('あなたのデータは危険です!');</script>
↓
↓ サニタイズ
↓
こんにちは!&lt;script&gt;alert('あなたのデータは危険です!');&lt;/script&gt;

このデータを画面に表示すると、ブラウザは次のように解釈します(例:<p>タグ内で表示)。

<p>こんにちは!&lt;script&gt;alert('あなたのデータは危険です!');&lt;/script&gt;</p>

Webページでは、&lt;と書くと<&gt;と書くと>が表示されます。そのため、上記のように変換すると、ブラウザには<script>がそのまま表示されます。すなわち、ブラウザでは以下のように表示されます。

こんにちは!<script>alert('あなたのデータは危険です!');</script>

このようにサニタイズすることで、<script>タグが無害なテキストとして表示され、ブラウザでの不正なスクリプトの実行を防ぐことができます。

本記事のまとめ

この記事では『サニタイズ』について、以下の内容を説明しました。

  • サニタイズとは
  • サニタイズの具体例

お読み頂きありがとうございました。