Перейти к содержанию

Руководство по интерфейсу

Eval AI Library включает интерактивный веб-дашборд с двумя основными модулями:

  • Dashboard — визуализация результатов оценки, метрик, графиков и деталей тест-кейсов
  • API Connector — подключение к любому LLM API, загрузка датасетов и запуск оценок прямо из браузера

Запуск дашборда

После оценки

results = asyncio.run(evaluate(
    test_cases=test_cases,
    metrics=metrics,
    show_dashboard=True,
    session_name="my-evaluation"
))

Дашборд автоматически откроется в браузере после завершения оценки.

Автономный режим

Просмотр кэшированных результатов предыдущих сессий:

eval-lib dashboard --port 14500 --host 0.0.0.0 --cache-dir .eval_cache
Флаг По умолчанию Описание
--port 14500 Порт сервера
--host 0.0.0.0 Хост сервера
--cache-dir .eval_cache Директория кэша результатов

Обзор

Обзор дашборда

Верхняя панель навигации предоставляет доступ к обоим модулям:

  • Dashboard — результаты оценки и аналитика
  • API Connector — визард для настройки оценки без кода
  • Переключатель темы — переключение между светлой и тёмной темами

Разделы

Раздел Описание
Dashboard Обзор сессий, сводка метрик, графики и результаты тестов
Детали тест-кейсов Подробный просмотр тест-кейсов с оценками по каждой метрике
Производительность Время ответа, использование токенов и анализ стоимости
API Connector Пошаговый визард для запуска оценок через любой API

Тёмная тема

Дашборд поддерживает светлую и тёмную темы. Нажмите кнопку переключения (☾/☀) в правом верхнем углу.

Дашборд в тёмной теме