LLM-репликация эксперимента «Ключевая ставка ЦБ»

Concordia (линейная) и AgentSociety (с социальным контекстом)

1. Выборка из датасета

Из датасета «Экономические ожидания» (N=2067, 843 переменных) отобрано 250 респондентов.

Критерии отбора

Характеристики подвыборки
N250
Возраст (M ± SD)44.7 ± 13.5 (17–78)
ПолМ = 139 (56%), Ж = 111 (44%)
Финансовая тревожность (M ± SD)4.20 ± 1.35
Распределение по группамСтабильная: 85 / Повышение: 82 / Снижение: 83
Распределение по когортам q030по 50 в каждой (1–5)
Переменные для построения профиля агента (10 переменных из .sav)

Все маппинги взяты из meta.variable_value_labels файла .sav (pyreadstat). Числовые шкалы переведены в текстовые градации для промпта.

ПеременнаяВопрос из анкетыЗначения в .savКонвертация в текст
sex
col #11
Ваш пол1 = Мужской, 2 = ЖенскийПрямая подстановка
age
col #12
Ваш возраст (полное число лет)17–89, M=43.6Число лет
q003
col #13
Каково Ваше основное занятие?1=Неработающий пенсионер, 2=Работающий пенсионер, 3=Неработающий студент, 4=Работающий студент, 5=Безработный, 6=Декрет, 7=Работаю в найме, 8=Предприниматель, 9=Самозанятый, 10=ДругоеValue label из .sav
q030
col #217
Как долго Вы могли бы прожить на имеющиеся сбережения при потере дохода?1=до 1 мес., 2=1–3 мес., 3=3–6 мес., 4=6–12 мес., 5=более года«Сбережений хватит на ...»
q029
col #215
Удаётся ли Вам сберегать часть дохода?1=Нет, расходую весь доход; 2=Периодически сберегаю, когда нужно накопить; 3=Стабильно сберегаю 10–20%; 4=Стабильно сберегаю 30%+Value label из .sav
finanx
col #316, вычисл.
Финансовая тревожность (агрегат)Шкала 1–10, M=4.204 градации: ≤2.5 «спокойно» / ≤4 «умеренная тревога» / ≤5.5 «заметная» / >5.5 «сильная»
q014
col #88
Как Вы планируете жизнь?1=На несколько лет; 2=На несколько месяцев; 3=Пока не строю планов (нестабильность); 4=Никогда не строю, живу сегодняшним днёмValue label из .sav
perceived_control
col #24
Всё в жизни зависит от вас самих vs от внешних обстоятельствШкала 0–10, M≈5.64 градации: ≤3 «мало зависит» / ≤5 «частично» / ≤7 «многое зависит» / >7 «сам определяет»
material1–3
col #80–82
«Восхищаюсь людьми с дорогими вещами» / «Люблю предметы роскоши» / «Был бы счастливее, если бы мог покупать больше»Шкала 1–7 каждый, берём среднее3 градации: ≤2.5 «не важны» / ≤4 «умеренно» / >4 «очень важен»
gen_trust1–3
col #26–28
«Большинству людей можно доверять» / «Люди выполняют обещания» / «Следует быть осторожными»Шкала 1–5 каждый, берём среднее4 градации: ≤2.5 «осторожен» / ≤4 «умеренно» / ≤5.5 «в целом доверяет» / >5.5 «высокое доверие»
Зависимая переменная: q032 (11 пунктов, шкала 1–7)

«Представьте, что у Вас есть свободные денежные средства, которые лежат на вкладе (депозите) в банке. Оцените вероятность каждого действия» (1 = совершенно точно не стану, 7 = совершенно точно стану):

#ПеременнаяПункт (точная формулировка из .sav)
1q032_001Оставить на текущем вкладе
2q032_002Снять для приобретения дорогостоящих услуг или товаров (техники, автомобиля и т.п.)
3q032_003Вложить в акции
4q032_004Вложить в облигации
5q032_005Вложить в золото
6q032_006Купить наличную иностранную валюту
7q032_007Купить криптовалюту
8q032_008Вложить в биржевой паевой инвестиционный фонд с ежемесячной выплатой дохода
9q032_009Купить жилую недвижимость
10q032_010Купить коммерческую недвижимость
11q032_011Снять для вложения в своё дело

2. Concordia: линейная репликация

Схема: профиль → стимул → LLM-ответ (1 запрос на агента). LLM: DeepSeek-V3. 250 агентов, 3 группы стимулов. Каждый агент получил тот же стимул, что его реальный прототип (a_b_c).

Средние по группам стимулов

1
7 — шкала вероятности действия
ПунктСтабильнаяПовышениеСнижениеANOVA LLM
Реал.LLMРеал.LLMРеал.LLMFp
Оставить на вкладе4.425.894.375.764.545.0833.5<.001
Дорогостоящие покупки3.011.873.241.573.512.2025.1<.001
Акции2.822.882.952.702.873.339.9<.001
Облигации2.714.332.984.602.904.844.9.008
Золото3.084.483.394.853.114.835.2.006
Валюта2.744.362.995.222.664.5212.6<.001
Криптовалюта2.001.342.441.382.291.222.6.078
Биржевой ПИФ2.734.352.874.022.904.637.6.001
Жилая недвиж.3.422.693.592.853.943.206.0.003
Комм. недвиж.2.651.912.841.892.892.223.7.026
Своё дело2.823.522.903.012.923.513.2.041

Агрегатные метрики Concordia

Корреляция групповых средних (33 точки)r = 0.49, p = .004
Средняя MAE1.12
Тимофей Александрович, завышение LLM - не обязательно ограничение платформы. В данном эксперименте (Concordia) агенту предъявлялись все вопросы опросника одномоментно. Вполне возможно, что агенты анализировали все варианты сразу, включали режим “финансового советника” и делали более рациональный выбор. Это можно пофиксить и предъявлять вопросы по одному.

ANOVA показала 0 значимых различий между группами у реальных респондентов и 10 из 11 у агентов. Вероятно, это объясняется тем, что для агента стимул занимает непропорционально большую долю контекста принятия решения, тогда как реальный человек фильтрует одну новость через жизненный опыт, привычки и т.д.

3. AgentSociety: линейная репликация (lite)

Схема: профиль → экономический контекст → стимул (message) → опрос q032. LLM: DeepSeek-V3. 250 агентов (85+82+83), все 3 группы стимулов. Те же ANSWERID, что в Concordia.

Отличие от Concordia: агенты размещены на карте Москвы, получают стимул через систему сообщений AS, отвечают через SurveyJS. Без «прожитого дня» — чистое сравнение платформ на одних и тех же данных.

Средние по группам стимулов

ПунктСтабильнаяПовышениеСнижение
Реал.ASРеал.ASРеал.AS
Оставить на вкладе4.423.354.373.264.543.29
Дорогостоящие покупки3.011.943.241.913.512.04
Акции2.822.002.951.962.872.23
Облигации2.712.652.982.392.902.82
Золото3.082.683.392.593.112.76
Валюта2.742.722.992.992.662.58
Криптовалюта2.001.832.441.802.291.94
Биржевой ПИФ2.732.232.872.072.902.45
Жилая недвиж.3.421.963.591.913.942.24
Комм. недвиж.2.651.782.841.612.891.89
Своё дело2.822.512.902.402.922.75

Агрегатные метрики AS

Корреляция групповых средних (33 точки)r = 0.55
Средняя MAE0.73

4. Сравнение Concordia vs AgentSociety

Сравнение по всем 3 группам (250 агентов), одни и те же ANSWERID.

ПунктРеал.ConcordiaAS|Δ| Conc.|Δ| ASБлиже
Оставить на вкладе4.425.893.351.471.07AS
Дорогостоящие покупки3.011.871.941.141.07AS
Акции2.822.882.000.060.82Conc
Облигации2.714.332.651.620.06AS
Золото3.084.482.681.400.40AS
Валюта2.744.362.721.620.02AS
Криптовалюта2.001.341.830.660.17AS
Биржевой ПИФ2.734.352.231.620.49AS
Жилая недвиж.3.422.691.960.731.46Conc
Комм. недвиж.2.651.911.780.740.87Conc
Своё дело2.823.522.510.690.32AS
ИтогоConc: 3 AS: 8
MAE: AS = 0.73, Concordia = 1.12. AgentSociety точнее в 1.5 раза по абсолютным отклонениям.
Корреляция r: AS = 0.55, Concordia = 0.49. AS также лучше по ранговой корреляции.

5. Выводы

  1. LLM частично воспроизводят структуру экономических ожиданий — r=0.49–0.55 на агрегате (33 точки).
  2. AS точнее Concordia — MAE 0.73 vs 1.12 (+35%), корреляция 0.55 vs 0.49. AS побеждает по 8 из 11 пунктов.
  3. Главная проблема Concordia — систематическое завышение инвестиционных инструментов: облигации (+1.62), золото (+1.40), валюта (+1.62), ПИФ (+1.62). AS этого не делает.
  4. Главная проблема AS — занижение недвижимости: жилая (−1.46), коммерческая (−0.87).
  5. LLM гиперчувствительны к стимулу — 10/11 значимых ANOVA у Concordia при 0/11 у реальных.
  6. Дисперсия систематически сжата — SD реальных: 1.5–1.7; Concordia: 0.5–1.5; AS: 0.3–0.6.

Ограничения