Пробираясь сквозь японский – XXX
Oct. 28th, 2022 09:53 pm.
Разобрал пятую серию второго сезона Yuru Camp за 13 дней. Перед разбором я её пересмотрел, и не обнаружив в кадре больших простыней текста, подобных журналу с вакансиями из предыдущей серии, решил что всё будет просто. Ха! Вместо больших простыней текста оказалась куча маленьких надписей, например на продуктах из магазина:

Нет, особых трудностей не было, но надписи отсутствующие в субтитрах приходится распознавать глазами и вбивать вручную. Вбивание японского текста вручную – та ещё задача! Впервые я догадался посчитать объём лексики надписей отдельно, и в этой серии он оказался равен 56%. Т.е. большая часть новой лексики – это не диалоги персонажей, а таблички мимо которых они проходят на улице и этикетки на продуктах!
Почему-то в этой серии внезапно и массово всплыли слова давно известные, но ранее в разбираемых текстах не встречавшиеся:
大根 дайкон – 1) дайкон, японская редька, Raphanus sativus; 2) сленг плохой актёр
鯨 кудзира – кит
キャンピング кямпингу – палаточный отдых (англ. camping)
Последнее особенно удивительно. В сериале про кемпинг слово "кямпингу" встретилось только в 17 серии! (До этого было 12 серий первого сезона).
Для статистики:
Слов в словаре перед началом разбора: 5811
Новых слов: 268 (к первым четырём сериям: 177, 250, 152, 277)
Частота появления новых слов*: 9.8 (к первым четырём сериям: 8.6, 11.1, 5.8, 9.8)
*) на килобайт .srt-субтитров
PS
1) Надо бы вести отдельную статистику по лексике разговорной и лексике письменной, что-то мне подсказывает что разговорная намного быстрее исчерпывается. Вернусь к уже разобранным сериям и посчитаю. В этой серии разговорная/письменная в соотношении 117/151.
2) Общее количество записей в словаре превысило 6000! 5811+268=6079
PPS Фрэнк считает что запись относится к категории 18+
Разобрал пятую серию второго сезона Yuru Camp за 13 дней. Перед разбором я её пересмотрел, и не обнаружив в кадре больших простыней текста, подобных журналу с вакансиями из предыдущей серии, решил что всё будет просто. Ха! Вместо больших простыней текста оказалась куча маленьких надписей, например на продуктах из магазина:

Нет, особых трудностей не было, но надписи отсутствующие в субтитрах приходится распознавать глазами и вбивать вручную. Вбивание японского текста вручную – та ещё задача! Впервые я догадался посчитать объём лексики надписей отдельно, и в этой серии он оказался равен 56%. Т.е. большая часть новой лексики – это не диалоги персонажей, а таблички мимо которых они проходят на улице и этикетки на продуктах!
Почему-то в этой серии внезапно и массово всплыли слова давно известные, но ранее в разбираемых текстах не встречавшиеся:
大根 дайкон – 1) дайкон, японская редька, Raphanus sativus; 2) сленг плохой актёр
鯨 кудзира – кит
キャンピング кямпингу – палаточный отдых (англ. camping)
Последнее особенно удивительно. В сериале про кемпинг слово "кямпингу" встретилось только в 17 серии! (До этого было 12 серий первого сезона).
Для статистики:
Слов в словаре перед началом разбора: 5811
Новых слов: 268 (к первым четырём сериям: 177, 250, 152, 277)
Частота появления новых слов*: 9.8 (к первым четырём сериям: 8.6, 11.1, 5.8, 9.8)
*) на килобайт .srt-субтитров
PS
1) Надо бы вести отдельную статистику по лексике разговорной и лексике письменной, что-то мне подсказывает что разговорная намного быстрее исчерпывается. Вернусь к уже разобранным сериям и посчитаю. В этой серии разговорная/письменная в соотношении 117/151.
2) Общее количество записей в словаре превысило 6000! 5811+268=6079
PPS Фрэнк считает что запись относится к категории 18+
no subject
Date: 2022-10-28 06:54 pm (UTC)Система категоризации Живого Журнала посчитала, что вашу запись можно отнести к категории: 18+ (https://www.livejournal.com/category/18+?utm_source=frank_comment).
Если вы считаете, что система ошиблась — напишите об этом в ответе на этот комментарий. Ваша обратная связь поможет сделать систему точнее.
Фрэнк,
команда ЖЖ.
no subject
Date: 2022-10-28 06:59 pm (UTC)– Категория 18+, конечно!
no subject
Date: 2022-10-30 10:35 am (UTC)no subject
Date: 2022-10-30 10:57 am (UTC)