<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
	<id>https://freemwiki.com/index.php?action=history&amp;feed=atom&amp;title=Openai%2F6954df4f-8108-8013-8152-3f6ade4423a7</id>
	<title>Openai/6954df4f-8108-8013-8152-3f6ade4423a7 - Revision history</title>
	<link rel="self" type="application/atom+xml" href="https://freemwiki.com/index.php?action=history&amp;feed=atom&amp;title=Openai%2F6954df4f-8108-8013-8152-3f6ade4423a7"/>
	<link rel="alternate" type="text/html" href="https://freemwiki.com/index.php?title=Openai/6954df4f-8108-8013-8152-3f6ade4423a7&amp;action=history"/>
	<updated>2026-06-19T13:41:02Z</updated>
	<subtitle>Revision history for this page on the wiki</subtitle>
	<generator>MediaWiki 1.43.3</generator>
	<entry>
		<id>https://freemwiki.com/index.php?title=Openai/6954df4f-8108-8013-8152-3f6ade4423a7&amp;diff=595160&amp;oldid=prev</id>
		<title>Lukegao: by freem.ai...</title>
		<link rel="alternate" type="text/html" href="https://freemwiki.com/index.php?title=Openai/6954df4f-8108-8013-8152-3f6ade4423a7&amp;diff=595160&amp;oldid=prev"/>
		<updated>2026-01-03T05:27:47Z</updated>

		<summary type="html">&lt;p&gt;by freem.ai...&lt;/p&gt;
&lt;p&gt;&lt;b&gt;New page&lt;/b&gt;&lt;/p&gt;&lt;div&gt;&lt;br /&gt;
{{DISPLAYTITLE:Самоэволюция нейросетей}}&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;This conversation was exported from ChatGPT&amp;#039;&amp;#039;&amp;lt;ref&amp;gt;{{cite web|title=Самоэволюция нейросетей|url=https://chatgpt.com/share/6954df4f-8108-8013-8152-3f6ade4423a7|publisher=ChatGPT|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== gpt-5-2-pro ==&lt;br /&gt;
=== User: Сделай по следующему тексту паттерн ML.2 по шаблону из  E.8, пиши для инженеров и добавь дидактичность в стиле написани… ===&lt;br /&gt;
Сделай по следующему тексту паттерн ML.2 по шаблону из  E.8, пиши для инженеров и добавь дидактичность в стиле написания, пиши по-русски.  Учти E.TGA и OEE для понимания, но не повторяй их положений в паттерне, используй обычный язык инженеров, а не лексику  FPF. Вот текст со ссылками на технологию: &lt;br /&gt;
&lt;br /&gt;
Hypernetworks That Evolve Themselves&lt;br /&gt;
Joachim Winther Pedersen, Erwan Plantec, Eleni Nisioti, Marcello Barylli, Milton Montero, Kathrin Korte, Sebastian Risi&lt;br /&gt;
Статья: https://arxiv.org/abs/2512.16406&lt;br /&gt;
Код: https://github.com/Joachm/self-referential_GHNs&lt;br /&gt;
Ревью: https://arxiviq.substack.com/p/hypernetworks-that-evolve-themselves&lt;br /&gt;
&lt;br /&gt;
=== TL;DR ===&lt;br /&gt;
&lt;br /&gt;
ЧТО сделали: Авторы предложили Self-Referential Graph HyperNetworks (GHNs) — класс нейросетей, способных генерировать параметры не только для решения задачи (policy), но и для создания собственного потомства. Встроив механизм стохастической вариации прямо в архитектуру, система интернализировала эволюционные операторы (мутацию и наследование), которые обычно находятся во внешних алгоритмах.&lt;br /&gt;
&lt;br /&gt;
ПОЧЕМУ это важно: Это структурный сдвиг от парадигмы «оптимизации фиксированной модели» к «моделям, которые оптимизируют сами себя». Подход показал превосходную адаптацию в нестационарных средах (где правила игры меняются на лету), обойдя традиционные стратегии вроде CMA-ES или OpenES. Работа доказывает, что «evolvability» (способность к эволюции) — это навык, который можно выучить в зависимости от контекста, а не фиксированная эвристика.&lt;br /&gt;
&lt;br /&gt;
Подробнее: https://t.me/gonzo_ML_podcasts/1895&lt;br /&gt;
&lt;br /&gt;
=== Assistant: ML.2 - Самореферентная GHN: встроенная «эволюция» для быстрой адаптации в меняющейся среде ===&lt;br /&gt;
==== ML.2 - Самореферентная GHN: встроенная «эволюция» для быстрой адаптации в меняющейся среде ====&lt;br /&gt;
&lt;br /&gt;
Type: ML / neuroevolution / архитектурный паттерн&lt;br /&gt;
Status: Draft&lt;br /&gt;
&lt;br /&gt;
===== ML.2:1 - Problem frame — где это применимо на практике =====&lt;br /&gt;
&lt;br /&gt;
Вы строите систему, которая должна продолжать работать, когда среда меняется: динамика, правила, инверсия управления, смена сенсоров/актуаторов, внезапный сдвиг распределения. При этом:&lt;br /&gt;
* Градиенты либо недоступны, либо бесполезны (чёрный ящик, недифференцируемые компоненты, дискретные решения, симулятор как «API»).&lt;br /&gt;
* Перетренировать модель «с нуля» долго, а надо “откатываться” к хорошему поведению за считанные итерации/поколения.&lt;br /&gt;
* Вы готовы платить параллельными прогонками (много воркеров, короткие эпизоды/батчи), но хотите экономить на внутреннем обучении каждого кандидата.&lt;br /&gt;
&lt;br /&gt;
Типовой пример из статьи — RL-бенчмарки с резкими сдвигами (CartPoleSwitch, LunarLander-Switch) и локомоция (Ant‑v5), где показана адаптация популяции после смены условий. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/abs/2512.16406|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===== ML.2:2 - Problem — почему «внешняя эволюция» часто не дотягивает =====&lt;br /&gt;
&lt;br /&gt;
Классические эволюционные стратегии и генетические алгоритмы обычно устроены так: есть оптимизатор (внешний код мутации/наследования/селекции) и есть оптимизируемая модель. Проблемы в инженерном смысле:&lt;br /&gt;
# Мутация слепая к структуре модели. Часто это «гауссов шум по всем весам» с глобальным шагом — без понимания, какие части архитектуры критичны, а какие можно «трясти» сильнее. ArXivIQ&amp;lt;ref&amp;gt;{{cite web|title=ArXivIQ|url=https://arxiviq.substack.com/p/hypernetworks-that-evolve-themselves|publisher=arxiviq.substack.com|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
# Шаг мутации приходится тюнить извне. После смены среды/правил оптимизатору нужно время «переобучить» ковариацию/шаг, и вы ловите провал качества. ArXivIQ&amp;lt;ref&amp;gt;{{cite web|title=ArXivIQ|url=https://arxiviq.substack.com/p/hypernetworks-that-evolve-themselves|publisher=arxiviq.substack.com|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
# Сложно встроить в продуктовый контур. Внешний оптимизатор живёт отдельным компонентом со своим состоянием, эвристиками и версиями; тяжело обеспечивать воспроизводимость, откат и понятный контроль рисков.&lt;br /&gt;
&lt;br /&gt;
===== ML.2:3 - Forces — компромиссы, которые нужно удерживать =====&lt;br /&gt;
&lt;br /&gt;
| Сила                              | Напряжение (что конфликтует)                                             |&lt;br /&gt;
| --------------------------------- | ------------------------------------------------------------------------ |&lt;br /&gt;
| Скорость адаптации                | Быстро “встать на ноги” после сдвига ↔ не разрушить то, что уже работало |&lt;br /&gt;
| Исследование vs эксплуатация      | Сильнее «трясти» модель ↔ удерживать стабильное качество                 |&lt;br /&gt;
| Стоимость оценок                  | Больше эпизодов/прогонов ↔ меньше времени и денег                        |&lt;br /&gt;
| Шум в фитнесе                     | Реальная метрика нестабильна ↔ селекция требует надёжного сигнала        |&lt;br /&gt;
| Управляемость релизов             | Онлайн-адаптация ↔ требования к safety/rollback/аудиту                   |&lt;br /&gt;
| Структурная осмысленность мутаций | Учитывать граф/архитектуру ↔ усложнять реализацию                        |&lt;br /&gt;
&lt;br /&gt;
===== ML.2:4 - Solution — что делаем и как это собрать =====&lt;br /&gt;
&lt;br /&gt;
Идея в одной фразе: вместо того чтобы держать «мутацию» снаружи, мы делаем так, чтобы модель сама генерировала свои вариации и тем самым “училась быть эволюционируемой”.&lt;br /&gt;
&lt;br /&gt;
====== 4.1. Архитектурный скелет ======&lt;br /&gt;
&lt;br /&gt;
Берём Graph HyperNetwork (GHN) как генератор весов: он читает вычислительный граф целевой сети и выдаёт параметры для её узлов/операторов (то есть «инициализирует» или «собирает» веса под конкретную архитектуру). OpenReview&amp;lt;ref&amp;gt;{{cite web|title=OpenReview|url=https://openreview.net/pdf?id=rkgW0oA9FX|publisher=openreview.net|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Дальше добавляем самореференцию, как в Self‑Referential GHN:&lt;br /&gt;
* Детерминированная ветка генерирует веса policy‑сети (или вашей рабочей сети), по которым мы измеряем качество в среде. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/html/2512.16406v1|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
* Стохастическая ветка генерирует возмущение для копии самой GHN, т.е. создаёт «потомка». Это делается через предсказание параметров шума (например, σ для гаусса с нулевым средним), плюс вводится управляемая интенсивность мутаций на уровне узлов/блоков. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/html/2512.16406v1|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Таким образом одна и та же сущность:&lt;br /&gt;
# порождает веса для политики (чтобы играть/управлять),&lt;br /&gt;
# порождает изменения своих же параметров (чтобы эволюционировать).&lt;br /&gt;
&lt;br /&gt;
====== 4.2. Эволюционный цикл (минимально достаточный) ======&lt;br /&gt;
&lt;br /&gt;
На уровне системы это выглядит как популяционный цикл:&lt;br /&gt;
# Инициализируем популяцию GHN-индивидов (разные веса). arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/html/2512.16406v1|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
# Каждый индивид: - генерирует policy‑веса детерминированно, - получает фитнес через прогоны в среде, - делает 1–N потомков: копия + добавление самосгенерированного возмущения. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/html/2512.16406v1|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
# Селекция: выбираем топ‑K по фитнесу (или более мягко: турнир/элитизм), получаем следующее поколение. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/html/2512.16406v1|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
# Ключевой эффект: популяция сама начинает регулировать «силу тряски» — в статье отмечено, что вариативность падает, когда найдено хорошее решение (эксплуатация), и остаётся выше на ранних этапах (поиск) без внешнего расписания. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/html/2512.16406v1|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
====== 4.3. Псевдокод (для закрепления) ======&lt;br /&gt;
&lt;br /&gt;
&amp;lt;syntaxhighlight lang=&amp;quot;text&amp;quot;&amp;gt;P = init_population(N)               # популяция гиперсетей&lt;br /&gt;
for gen in 1..G:&lt;br /&gt;
  C = []                             # кандидаты (родители + потомки)&lt;br /&gt;
  for h in P:&lt;br /&gt;
    # 1) делаем потомков&lt;br /&gt;
    for i in 1..offspring_per_parent:&lt;br /&gt;
      child = copy(h)&lt;br /&gt;
      delta = h.stochastic_self_update(graph_of(h))   # шум/апдейты, сгенерированные самим h&lt;br /&gt;
      child.params += delta&lt;br /&gt;
      C.append(child)&lt;br /&gt;
    C.append(h)&lt;br /&gt;
&lt;br /&gt;
  # 2) оцениваем всех&lt;br /&gt;
  for h in C:&lt;br /&gt;
    w_policy = h.det_generate(policy_graph)&lt;br /&gt;
    h.fitness = rollout(env, w_policy, seeds, episodes)&lt;br /&gt;
&lt;br /&gt;
  # 3) селекция&lt;br /&gt;
  P = select_top_k(C, K)&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/syntaxhighlight&amp;gt;&lt;br /&gt;
&lt;br /&gt;
(Подробности про то, что именно предсказывается стохастической веткой и как устроена узло‑специфичная интенсивность мутации, см. описание в arXiv‑версии; в частности, используется генерация σ и масштабирование “mutation rate” на узлах. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/html/2512.16406v1|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;)&lt;br /&gt;
&lt;br /&gt;
====== 4.4. Инженерные правила сборки (то, что обычно ломает внедрение) ======&lt;br /&gt;
# Версионируйте среду и интерфейсы. Если “среда поменялась”, это должно быть выражено в конфиге/версии, иначе вы смешаете фитнесы из разных миров и селекция станет шумом.&lt;br /&gt;
# Делайте реплей и воспроизводимость. Логи: seed’ы, конфиги, распределение фитнеса, параметры шума/вариативности, идентификатор “чемпиона”, lineage (кто чей потомок).&lt;br /&gt;
# Ограничьте онлайн‑самоизменение в проде. Практика: адаптацию гонять в песочнице/канареечном контуре и «поднимать» нового чемпиона только после регрессионного набора тестов (см. чек‑лист ниже).&lt;br /&gt;
# Сразу проектируйте параллелизм. ES‑подходы масштабируются воркерами; Self‑Referential GHN тоже выигрывает от параллельной оценки популяции. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/abs/1703.03864|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===== ML.2:5 - Archetypal Grounding — два примера, чтобы “схватить” идею =====&lt;br /&gt;
&lt;br /&gt;
Суть (Tell): мы превращаем «оператор мутации» из внешней эвристики в часть модели. Тогда селекция начинает оптимизировать не только поведение в задаче, но и способ изменения самой модели под контекст.&lt;br /&gt;
&lt;br /&gt;
Пример как система (Show #1):&lt;br /&gt;
Представьте контроллер для робота/дрона/манипулятора, у которого периодически меняются условия: нагрузка, трение, задержки, инверсия оси управления (условно “перепутали полярность”). Вам нужна схема, которая:&lt;br /&gt;
* быстро перестраивает управление без дифференцирования по физике,&lt;br /&gt;
* умеет «снизить хаос», когда снова стало стабильно,&lt;br /&gt;
* не требует ручного тюнинга шага мутации под каждый сценарий.&lt;br /&gt;
&lt;br /&gt;
Self‑Referential GHN как раз демонстрируется на задачах с резкими переключениями условий, где популяция восстанавливает качество за несколько поколений. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/html/2512.16406v1|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Пример как эпистема/метод (Show #2):&lt;br /&gt;
Вы строите AutoML/контур оптимизации, где вместо фиксированного “оптимизатора гиперпараметров” хотите, чтобы система сама выучила стратегию исследования (когда агрессивно искать, когда стабилизироваться). Это родственно:&lt;br /&gt;
* learned optimizers (оптимизатор как обучаемая модель), arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/abs/1606.04474|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
* популяционным схемам, которые учат расписания гиперпараметров (PBT), arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/abs/1711.09846|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
* и open‑ended подходам, где важен перенос решений между меняющимися задачами (POET). arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/abs/1901.01753|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Разница тут в том, что «правила вариативности» кодируются внутри самой гиперсети и подпадают под отбор. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/html/2512.16406v1|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===== ML.2:6 - Bias-Annotation — где вас может обмануть результат =====&lt;br /&gt;
* Байас бенчмарков: “Switch‑среды” могут быть проще реальных сдвигов (в реальности часто медленный дрейф + редкие скачки). arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/html/2512.16406v1|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
* Байас вычислительного бюджета: если у вас меньше воркеров/эпизодов, селекция становится шумной, «саморегуляция вариативности» может не проявиться.&lt;br /&gt;
* Байас по seed’ам: эволюционные методы чувствительны к шуму оценок; без мультисидов и усреднения вы будете видеть “ложные чемпионы”.&lt;br /&gt;
* Байас индуктивной структуры: графовое представление архитектуры задаёт, где именно модель может «умно» дифференцировать мутации; при плохом граф‑энкодинге получите почти случайный поиск. OpenReview&amp;lt;ref&amp;gt;{{cite web|title=OpenReview|url=https://openreview.net/pdf?id=rkgW0oA9FX|publisher=openreview.net|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===== ML.2:7 - Conformance Checklist — что должно быть выполнено =====&lt;br /&gt;
# Определён контракт среды: что считается «сменой условий», какие параметры среды/симулятора логируются и сравниваются.&lt;br /&gt;
# Есть воспроизводимость оценки: фиксируем seed’ы, набор эпизодов/сценариев, версию среды, версии кода/модели.&lt;br /&gt;
# Фитнес устойчив: используете либо несколько эпизодов на индивида, либо повторную оценку для топ‑кандидатов (re‑eval), либо бутстрэп/медиану.&lt;br /&gt;
# Явно ограничена вариативность: есть верхние границы на шум/дельты, есть аварийный “стоп” при деградации.&lt;br /&gt;
# Разделены контуры: (а) поиск/адаптация, (б) промоутинг в эксплуатацию. В релиз попадает только проверенный «чемпион».&lt;br /&gt;
# Линейдж и откат: вы можете ответить “из каких родителей получился этот кандидат” и быстро откатиться на стабильного предка.&lt;br /&gt;
# Мониторинг популяции: трекаете распределение фитнеса и показатель “разброса” (вариативности) — иначе вы не заметите коллапс в один клон.&lt;br /&gt;
# Параллелизм не меняет смысл: увеличение воркеров должно давать ускорение, а не менять поведение из-за гонок/асинхронных багов (особенно если делаете асинхронную селекцию).&lt;br /&gt;
&lt;br /&gt;
===== ML.2:8 - Common Anti-Patterns That Break It — типовые способы сломать паттерн =====&lt;br /&gt;
* “Запустим эволюцию прямо в проде без предохранителей.” Итог: дрейф качества, необъяснимые регрессии, невозможность расследования.&lt;br /&gt;
* Оценка на одном эпизоде. Шум доминирует, селекция выбирает lucky‑run.&lt;br /&gt;
* Смешивание разных конфигов среды в одной популяции. Фитнесы становятся несравнимы → вы отбираете мусор.&lt;br /&gt;
* Внешний фиксированный шаг мутации “поверх” саморегуляции. Вы забиваете сигнал отбора: модель не может “научиться трястись” в нужные моменты.&lt;br /&gt;
* Никакого учёта структуры. Если вы подали неверный граф или упростили до “вектор весов”, вы возвращаетесь к слепому шуму, теряя главную идею GHN. OpenReview&amp;lt;ref&amp;gt;{{cite web|title=OpenReview|url=https://openreview.net/pdf?id=rkgW0oA9FX|publisher=openreview.net|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
* Нет чётких ограничений по бюджету. Эволюция легко «съедает» весь compute, если не поставить лимиты на поколения/эпизоды/воркеры.&lt;br /&gt;
&lt;br /&gt;
===== ML.2:9 - Consequences — что получите и чем заплатите =====&lt;br /&gt;
&lt;br /&gt;
Что выигрываете:&lt;br /&gt;
* Быстрая адаптация к нестационарности (показано на Switch‑задачах). arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/html/2512.16406v1|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
* Производная не нужна: можно оптимизировать недифференцируемые элементы, дискретные архитектуры, “симулятор как чёрный ящик”. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/html/2512.16406v1|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
* Самонастройка интенсивности поиска: вариативность может снижаться, когда найдено хорошее семейство решений, и снова расти при необходимости — без внешнего расписания. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/html/2512.16406v1|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Цена/риски:&lt;br /&gt;
* Высокая стоимость оценок: это всё равно популяционный метод; выгоден при хорошей параллелизации. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/abs/1703.03864|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
* Сложнее дебажить: у вас одновременно эволюционирует “как действовать” и “как изменяться”.&lt;br /&gt;
* Риск неконтролируемого дрейфа, если не построить guardrails (лимиты, тесты, промоутинг через гейт).&lt;br /&gt;
* Инженерная сложность граф‑представления и корректного соответствия “узлы ↔ параметры”.&lt;br /&gt;
&lt;br /&gt;
===== ML.2:10 - Rationale — почему механизм даёт эффект =====&lt;br /&gt;
&lt;br /&gt;
В классической схеме вы фиксируете оператор мутации/наследования и оптимизируете только поведение модели. Здесь вы делаете шаг в сторону “оптимизировать оптимизатор”: способность менять себя становится частью модели и попадает под отбор — ровно то, что давно делается в learned optimizers, но в другом форм‑факторе. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/abs/1606.04474|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Дополнительный усилитель — графовая осмысленность: GHN видит структуру архитектуры, поэтому вариативность можно распределять по узлам/блокам, а не шуметь равномерно по всему вектору весов. OpenReview&amp;lt;ref&amp;gt;{{cite web|title=OpenReview|url=https://openreview.net/pdf?id=rkgW0oA9FX|publisher=openreview.net|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===== ML.2:11 - SoTA-Echoing — связь с современной линией работ (2016+) =====&lt;br /&gt;
* Graph HyperNetworks (2018): GHN как быстрый генератор весов по вычислительному графу, изначально для удешевления NAS. ML.2 использует тот же “graph‑aware weight generation”, но замыкает петлю на саму гиперсеть. OpenReview&amp;lt;ref&amp;gt;{{cite web|title=OpenReview|url=https://openreview.net/pdf?id=rkgW0oA9FX|publisher=openreview.net|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
* Evolution Strategies в RL (2017): масштабируемая производно‑свободная оптимизация, хорошо ложится на параллельные воркеры. ML.2 остаётся в этой семье, но делает вариативность эндогенной (встроенной). arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/abs/1703.03864|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
* CMA‑ES (tutorial 2016) как представитель “умных” внешних стратегий; в обзоре к статье подчёркивается сравнение с CMA‑ES/OpenES на нестационарности. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/abs/1604.00772|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
* Population Based Training (2017): популяция + автоматическое расписание гиперпараметров. ML.2 похож духом (популяция как механизм адаптации), но переносит “расписание” на уровень самой модели (через само‑мутацию). arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/abs/1711.09846|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
* Self‑reference линия (2018–2024): Neural Network Quine (2018), SRWM (2022), SeRANN (2024) — разные способы сделать модель самореферентной/самоизменяющейся. ML.2 добавляет масштабируемость через GHN‑подход и убирает градиентные апдейты из самого эволюционного цикла. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/abs/1803.05859|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
* POET (2019): акцент на смене задач и переносе решений. ML.2 логично комбинируется с такими постановками, потому что показывает сильную сторону именно в нестационарных режимах. arXiv&amp;lt;ref&amp;gt;{{cite web|title=arXiv|url=https://arxiv.org/abs/1901.01753|publisher=arxiv.org|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
* Контекст по гиперсетям в целом: обзорные работы по hypernetworks (2024). Springer Link&amp;lt;ref&amp;gt;{{cite web|title=Springer Link|url=https://link.springer.com/article/10.1007/s10462-024-10862-8|publisher=Springer Link|access-date=2026-01-02}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===== ML.2:12 - Relations — с чем хорошо сочетается в инженерном стеке =====&lt;br /&gt;
* Детектор дрейфа/смены условий → переключение режима адаптации. (Если просадка качества/анализ телеметрии сигналит о смене, можно временно увеличить допустимую вариативность и расширить поиск.)&lt;br /&gt;
* Canary/Shadow‑режимы для промоутинга чемпиона. Эволюция остаётся «внутри», но выпуск наружу делается как обычный релиз.&lt;br /&gt;
* Портфель решений вместо одного. Храните несколько топ‑индивидов под разные «режимы среды» и быстро переключайтесь.&lt;br /&gt;
* PBT‑подходы и многокритериальные селекторы. Можно селектировать не только по среднему фитнесу, но и по риску/вариативности/стабильности.&lt;br /&gt;
&lt;br /&gt;
===== ML.2:End =====&lt;br /&gt;
&lt;br /&gt;
== References ==&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Category:ChatGPT Shares]]&lt;br /&gt;
[[Category:openai]]&lt;/div&gt;</summary>
		<author><name>Lukegao</name></author>
	</entry>
</feed>