utsuwa

文字数カウント

入力した文章の文字数・単語数・行数・バイト数をリアルタイムで数えます。空白あり/なしの切り替え、原稿用紙換算、全角半角の内訳にも対応。入力は端末内で処理され送信されません。

文字数(空白込み)

0

文字数(空白込み)
0
文字数(空白なし)
0
単語数
0
行数
0
段落数
0
バイト数(UTF-8)
0
原稿用紙(400字)
0枚
全角
0
半角
0

入力したテキストはお使いの端末内で処理され、サーバーには送信されません。

原稿用紙換算は「文字数÷400」の概算です。字下げ・禁則・改行で生じる空きマスは考慮しないため、公募・提出規定の枚数判定とは異なる場合があります。

日本語の単語数は辞書ベースの自動分割による目安で、数え方が変わることがあります。

使い方

テキストを貼り付けるか入力すると、文字数・単語数・行数・バイト数などがその場で更新されます。送信ボタンはありません。「空白・改行を文字数に含める」をオフにすると、空白と改行を除いた実質の文字数を主表示に切り替えられます。

使いどころは具体的です。レポートや卒論の「○○字以内」チェック、Web記事のタイトルやmeta description(120字前後)の字数調整、公募小説の「400字詰め○枚」換算、SNS投稿前の字数確認など。文字数の制限がある場面で、提出前にすばやく確認するのに向いています。

「文字数」の数え方は1つではない

同じ文章でも、数え方によって文字数は変わります。空白や改行を含めるか(Wordのカウントは「空白を含む/含まない」を別々に表示します)、原稿用紙のように字下げや改行の空きマスを1マスと数えるか、全角・半角を区別するか――提出先によって基準が違うため、「正しい文字数」は一つに決まりません。本ツールは空白込み・空白なしを同時に表示し、原稿用紙換算や全角半角の内訳も併記して、目的に合わせて読み取れるようにしています。

絵文字や濁点付きの文字が「複数文字」に数えられた経験はありませんか。これはコンピュータの文字の数え方が3層あるためです。プログラムでよく使われる文字数(UTF-16のコードユニット)では絵文字が2、家族絵文字👨‍👩‍👧‍👦は11に数えられます。コードポイント単位だと家族絵文字は7。しかし人が見る「1文字」は書記素クラスタという単位で、これだと1文字です。本ツールは既定でこの書記素クラスタ(見た目の1文字)で数えるため、絵文字も結合文字(か+濁点=が)も国旗🇯🇵も1文字として正しく数えます。フォームやデータベースの文字数制限で弾かれるのは、システム側がコードポイントやUTF-16で数えているのが原因です。バイト数はUTF-8基準で、半角は1バイト、全角の多くは約3バイト、絵文字は4バイト以上です(Shift_JISでは全角2バイトで異なります)。

よくある質問

「空白あり」と「空白なし」のどちらが正しい文字数ですか?
提出先のルール次第です。Wordは両方を表示し、原稿用紙は字下げ・改行の空きマスを含み、申込フォームの制限はシステムの仕様によります。本ツールは両方を同時に表示するので、提出先の基準に合う方を読み取ってください。
絵文字や「が(濁点付き)」が複数文字に数えられるのはなぜ?
文字の数え方が複数あるためです。本ツールは既定で書記素クラスタ(人が見る1文字)で数えるので、絵文字も結合文字も1文字です。一方、システムによってはコードポイントやUTF-16で数え、絵文字を2文字以上とすることがあります。フォームで弾かれる場合はそれが原因です。
バイト数は何に使う? Shift_JISだと違う?
データベースのカラム長、メールやAPIのバイト制限などの確認に使います。本ツールはUTF-8基準で、全角はおおむね3バイトです。Shift_JISは全角2バイトなので、同じ文章でもバイト数は異なります。
原稿用紙○枚はこの換算で大丈夫?
目安としてはお使いいただけますが、字下げ・禁則・改行で生じる空きマスを考慮しない概算です。実際の枚数は組版によってずれるため、公募などの「○枚以内」規定は、提出先が指定する数え方に従ってください。