Zzong's Notes

❯

machine_learning

❯

❯

❯

MT-bench

2026년 6월 14일1 min read

MT-bench

MT-bench LLM 모델을 평가하기 위한 multi-turn open-ended 질문 모음

To automate the evaluation process, we prompt strong LLMs like GPT-4 to act as judges and assess the quality of the models’ responses.

B) 논문 주장

strong LLM judges like GPT-4 can match both controlled and crowdsourced human preferences well, achieving over 80% agreement, the same level of agreement between humans.

C) Methods

MT-bench 질문들에 대해 타겟 모델의 응답을 생성한다.
GPT-4 의 평가 (judgement) 들을 생성한다.
1. 여러 옵션이 존재한다: (1) pairwise winrate, (2) single-answer grading (default)
MT-bench 점수를 계산한다.

D) Related

E) References

github: llm_judge
paper: [2306.05685] Judging LLM-as-a-judge with MT-Bench and Chatbot Arena

함께 보면 좋은 글

llm_as_classifier

llm as classifier 왜 전통적인 분류 모델을 사용하지 않고, LLM 을 통해 분류 문제를 해결하려 할까? B) LLM 만의 장점 학습 데이터셋이 많지 않은 경우, 빅 모델이 성능 면에서 더 효율적일 수 있다.

FastChat

FastChat LLM 파인 튜닝 용 라이브러리 B) Arguments Description tf32 C) Related D) References.

vicuna

Vicuna ShareGPT 에서 모은 약 125K 개의 사용자 대화 데이터를 기반으로 파인튜닝한 Llama 기반 모델 B) Training B.1) 데이터셋 ShareGPT 데이터셋은 공개하지 않음 B.1.1) Preprocessing To ensure data quality, we convert the...

MMLU

GPT-2

GPT-2 Let’s reproduce GPT-2 (124M) - YouTube B) Questions dropout 은 왜 softmax 이후에 적용하는 걸까? GPT 모델에서 cheating 방지를 위해 masking 하는 방식은 아직도 이해를 잘 못하겠음.

Batch Decoding

Batch Decoding LLM API 콜 할때 시간/비용이 많이 요구되는 이슈를 해결하기 위해 사용하는 방법 일종의 프롬프트 엔지니어링 처럼 해결하는 것으로 보임 PROMPT = """\ 다양한 작업에 대한 답변을 생성해주세요, 이러한 작업 지침은 ChatGPT 모델에 주어지며,...

Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs

Paper page - Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs RLVR의 역설 배경: LLM의 추론 능력을 향상시키기 위해 RLVR(검증 가능한 보상을 이용한 강화학습)...

LIMA

LIMA 특정 태스크 수행 능력을 위해 소량의 잘 검수된 데이터가 조금이라도 들어가면 도움이 된다는것이지만, 질이 떨어지는 데이터도 대량으로 있으면 역시 성능 향상에 도움이 된다는점인것 같습니다.

GPT

GPT B) Related C) References.

RLHF

RLHF 단순한 next token prediction loss 와 같은 loss function 은 좋은 언어 모델을 학습하는데 제한적이다. 이를 보완하기 위해서 사용자의 선호도를 직접 모델에 알려줄 수 있는 강화 학습 방식을 적용할 수 있다.

MT-bench
B) 논문 주장
C) Methods
D) Related
E) References