ユニコード文字では、複数の文字(コードポイント)を組み合わせて1つの文字とすることができる。たとえば、人物の絵文字では、スキントーン指定文字(EMOJI MODIFIER FITZPATRICK TYPE-x)を、使って肌の色を指定できる。さらに、ZERO WIDTH JOINERを使って複数の人物を組み合わせることができる。こうして作られた「文字」は、1つの絵文字になるが、複数のコードポイントから構成される。こうしたまとまりを「書記素」(Graphem。グラフィーム)という。
かつては文字は、バイトやワードで表現されていたが、今や文字列処理は、そういう簡単なものではなくなってきた。