Загружаем соревнования
Загружаем соревнования
Отбор на программу повышения квалификации
Дедлайн: 15/07/2026, 14:52
Нужно построить модель, которая предсказывает цену смартфона в рублях по его исходным характеристикам.
Даны файлы:
train.csv - обучающая выборка. Содержит исходные признаки и целевую колонку price.test.csv - тестовая выборка. Содержит исходные признаки без price.sample_submission.csv - пример файла с предсказаниями.baseline.ipynb - простой стартовый baseline на исходных признаках.Основная метрика - MAE (Mean Absolute Error) в рублях. Чем меньше MAE, тем лучше.
Тестовая часть разделена на две части: Public и Private примерно 50 на 50.
Public - это открытая часть теста. Во время соревнования именно по ней считается видимый score. Он нужен, чтобы участники могли понимать, стало их решение лучше или хуже.
Private - это скрытая финальная часть теста. Во время соревнования она не используется для видимого результата. После окончания соревнования итоговый score считается именно на Private.
Такое разделение нужно, чтобы участники не подгоняли решение только под видимую часть теста. Хорошее решение должно стабильно работать и на Public, и на Private.
В train.csv и test.csv лежат только исходные признаки. Как и в реальных выгрузках, некоторые значения могут быть записаны неидеально: встречаются разные единицы измерения, смешанные типы и пропуски. Перед обучением полезно внимательно проверить распределения и форматы признаков.
Файл предсказаний должен содержать колонки id и price. Колонка id нужна, чтобы проверка могла однозначно сопоставить каждое предсказание со строкой из test.csv:
id,price
0,49999.0
1,34999.0