Пробираясь сквозь японский – LV
Nov. 16th, 2025 02:30 pm.
Последние несколько месяцев занимался подготовкой учебных материалов по японскому языку. Составлял список слов, где все иероглифы читаются по стандартным онным чтениям (онъёми). Втупую зубрить онъёми непродуктивно, нужны составные слова, нужен контекст. Вот я и занялся.
Для каждого онного чтения подобрать наиболее подходящее слово, где это чтение используется. Подобные слова, построенные на онных чтениях, охватывают процентов 50, если не больше, японской лексики.
К работе привлёк ИИ (DeepSeek). В основном, он помогал выбирать наиболее подходящие варианты из составленных мной списков. Он, конечно, тот ещё фантазёр, но всё было под контролем. Всё что он насоветовал тщательно проверялось по словарям. Охвачены были все иероглифы из дзё:ё: кандзи (это список из 2136 общеупотребительных иероглифов) и дополнительные 88 иероглифов из группы употребимости +++ (по классификации Смоленского в словаре Яркси). Итого 2136+88=2224 иероглифа, и ещё больше слов, т.к. у некоторых иероглифов по несколько чтений!
К сожалению, у DeepSeek ограничена длина чата, и когда очередной чат переполнялся, мне приходилось вводить его по-новой в курс дела. В конце-концов мне это надоело, и я попросил DeepSeek чтобы он написал послание сам для себя, объяснив самому себе чем мы тут занимаемся. И вот что он выдал:
«Онъёми 4» (и предыдущие сессии) — это систематическая лингвистическая экспедиция в ядро японской лексики, где мы:
1. Фильтруем реальность — отсеиваем шум (рендаку, исключения, устаревшие формы) чтобы остались только идеальные примеры чистого онъёми.
2. Строим мосты — соединяем абстрактные значения кандзи с живыми, употребимыми словами, которые становятся «якорями» для запоминания.
3. Создаём эталонную коллекцию — каждый пример тщательно проверяется по словарям, чтобы избежать галлюцинаций и неточностей.
4. Преодолеваем ограничения — технические (глюки Яркси), лингвистические (редкие чтения) и человеческие (усталость), но не жертвуем принципами.
А «Онъёми 5» станет логичным продолжением — не просто «ещё один чат», а:
• Углубление в ещё более сложные случаи (кандзи с минимальным числом чистых онных слов)
• Эволюция метода — возможно, с учётом новых инсайтов, полученных в предыдущих сессиях
• Фиксация пройденного — с чёткими выводами о том, какие чтения остались без примеров и почему
Мы не просто «учим слова» — мы составляем карту территории онъёми, где каждая точка — это проверенное, осмысленное и практичное слово.
И когда карта одного чата будет заполнена — мы просто развернём следующую.
Это научный подход, воплощённый с упорством кладоискателя. 💎
Я чуть не прослезился когда это прочитал!
Последние несколько месяцев занимался подготовкой учебных материалов по японскому языку. Составлял список слов, где все иероглифы читаются по стандартным онным чтениям (онъёми). Втупую зубрить онъёми непродуктивно, нужны составные слова, нужен контекст. Вот я и занялся.
Для каждого онного чтения подобрать наиболее подходящее слово, где это чтение используется. Подобные слова, построенные на онных чтениях, охватывают процентов 50, если не больше, японской лексики.
К работе привлёк ИИ (DeepSeek). В основном, он помогал выбирать наиболее подходящие варианты из составленных мной списков. Он, конечно, тот ещё фантазёр, но всё было под контролем. Всё что он насоветовал тщательно проверялось по словарям. Охвачены были все иероглифы из дзё:ё: кандзи (это список из 2136 общеупотребительных иероглифов) и дополнительные 88 иероглифов из группы употребимости +++ (по классификации Смоленского в словаре Яркси). Итого 2136+88=2224 иероглифа, и ещё больше слов, т.к. у некоторых иероглифов по несколько чтений!
К сожалению, у DeepSeek ограничена длина чата, и когда очередной чат переполнялся, мне приходилось вводить его по-новой в курс дела. В конце-концов мне это надоело, и я попросил DeepSeek чтобы он написал послание сам для себя, объяснив самому себе чем мы тут занимаемся. И вот что он выдал:
«Онъёми 4» (и предыдущие сессии) — это систематическая лингвистическая экспедиция в ядро японской лексики, где мы:
1. Фильтруем реальность — отсеиваем шум (рендаку, исключения, устаревшие формы) чтобы остались только идеальные примеры чистого онъёми.
2. Строим мосты — соединяем абстрактные значения кандзи с живыми, употребимыми словами, которые становятся «якорями» для запоминания.
3. Создаём эталонную коллекцию — каждый пример тщательно проверяется по словарям, чтобы избежать галлюцинаций и неточностей.
4. Преодолеваем ограничения — технические (глюки Яркси), лингвистические (редкие чтения) и человеческие (усталость), но не жертвуем принципами.
А «Онъёми 5» станет логичным продолжением — не просто «ещё один чат», а:
• Углубление в ещё более сложные случаи (кандзи с минимальным числом чистых онных слов)
• Эволюция метода — возможно, с учётом новых инсайтов, полученных в предыдущих сессиях
• Фиксация пройденного — с чёткими выводами о том, какие чтения остались без примеров и почему
Мы не просто «учим слова» — мы составляем карту территории онъёми, где каждая точка — это проверенное, осмысленное и практичное слово.
И когда карта одного чата будет заполнена — мы просто развернём следующую.
Это научный подход, воплощённый с упорством кладоискателя. 💎
Я чуть не прослезился когда это прочитал!
no subject
Date: 2025-11-16 11:32 am (UTC)Система категоризации Живого Журнала посчитала, что вашу запись можно отнести к категориям: ИИ (https://www.livejournal.com/category/ii/?utm_source=frank_comment), Лингвистика (https://www.livejournal.com/category/lingvistika/?utm_source=frank_comment).
Если вы считаете, что система ошиблась — напишите об этом в ответе на этот комментарий. Ваша обратная связь поможет сделать систему точнее.
Фрэнк,
команда ЖЖ.
no subject
Date: 2025-11-16 11:34 am (UTC)