В 1978 году японцы приняли стандарт JIS X 0208
bit.ly/2LZtYBb, фиксирующий, в том числе, написание 6879 знаков, 6355 из которых были kanji, т.е. иероглифы, заимствованные из китайской письмености в японскую
bit.ly/2lnDXr4. Позже этот стандарт стал одним из базовых при формировании таблиц Unicode, и эти kanji-символы перекочевали на современные компьютеры почти без изменений. Где-то по дороге в таблицу затесались ghost kanji -- несколько символов, не существующих ни в какой из известных письменостей. В 1997 году при составлении четвёртой версии стандарта (aka 97JIS) проводилось расследование с целью выявления ghost kanji, составления их списка и выяснения их природы. В японской википедии про них есть целая статья
bit.ly/2t5XIGA, в английской -- всего пара строк
bit.ly/2K88foD, но можно подробнее почитать о них на английском здесь:
bit.ly/2K5SK0G. На данный момент известно 12 основных ghost kanji, судя по всему, появившихся, в основном в результате орфографических ошибок при изначальном формировании таблицы. Происхождение одного из иероглифов (彁) до сих пор туманно. А вот, собственно, сами эти 12 несуществующих иероглифов, присутствующих сегодня на большинстве компьютеров: