Seungone Kim's picture

Seungone Kim PRO

seungone

·

https://seungonekim.github.io/

AI & ML interests

Large Language Models, Alignment Problem, Commonsense Reasoning

Organizations

seungone's activity

upvoted a paper 17 days ago

Consent in Crisis: The Rapid Decline of the AI Data Commons

Paper • 2407.14933 • Published Jul 20 • 11

upvoted a paper 3 months ago

The BiGGen Bench: A Principled Benchmark for Fine-grained Evaluation of Language Models with Language Models

Paper • 2406.05761 • Published Jun 9 • 2

upvoted a collection 3 months ago

System Message Generalization

11 items • Updated Jun 7 • 3

upvoted a paper 3 months ago

Aligning to Thousands of Preferences via System Message Generalization

Paper • 2405.17977 • Published May 28 • 6

upvoted an article 4 months ago

Article

Let's talk about LLM evaluation

By

•

May 23

• 104

upvoted 3 papers 5 months ago

Prometheus 2: An Open Source Language Model Specialized in Evaluating Other Language Models

Paper • 2405.01535 • Published May 2 • 114

Self-Explore to Avoid the Pit: Improving the Reasoning Capabilities of Language Models with Fine-grained Rewards

Paper • 2404.10346 • Published Apr 16 • 1

The CoT Collection: Improving Zero-shot and Few-shot Learning of Language Models via Chain-of-Thought Fine-Tuning

Paper • 2305.14045 • Published May 23, 2023 • 5

upvoted a paper 6 months ago

Language Models as Compilers: Simulating Pseudocode Execution Improves Algorithmic Reasoning in Language Models

Paper • 2404.02575 • Published Apr 3 • 47

upvoted a paper 7 months ago

LangBridge: Multilingual Reasoning Without Multilingual Supervision

Paper • 2401.10695 • Published Jan 19 • 4

upvoted 6 papers 8 months ago

Prometheus-Vision: Vision-Language Model as a Judge for Fine-Grained Evaluation

Paper • 2401.06591 • Published Jan 12 • 3

Mind the Gap! Injecting Commonsense Knowledge for Abstractive Dialogue Summarization

Paper • 2209.00930 • Published Sep 2, 2022 • 2

Exploring the Benefits of Training Expert Language Models over Instruction Tuning

Paper • 2302.03202 • Published Feb 7, 2023 • 1

CoTEVer: Chain of Thought Prompting Annotation Toolkit for Explanation Verification

Paper • 2303.03628 • Published Mar 7, 2023 • 2

Personalized Soups: Personalized Large Language Model Alignment via Post-hoc Parameter Merging

Paper • 2310.11564 • Published Oct 17, 2023 • 2

FLASK: Fine-grained Language Model Evaluation based on Alignment Skill Sets

Paper • 2307.10928 • Published Jul 20, 2023 • 12

upvoted 2 collections 8 months ago

The Perception Collection

Dataset and Model for "Prometheus-Vision: Vision-Language Model as a Judge for Fine-Grained Evaluation" • 5 items • Updated Jan 15 • 4

The Feedback Collection

Dataset and Model for "Prometheus: Inducing Fine-grained Evaluation Capability in Language Models" • 6 items • Updated Nov 12, 2023 • 3

upvoted a collection 10 months ago

The CoT Collection

Dataset and Model for "The CoT Collection: Improving Zero-shot and Few-shot Learning of Language Models via Chain-of-Thought Fine-Tuning" • 5 items • Updated Apr 3 • 4

upvoted a paper 11 months ago

Prometheus: Inducing Fine-grained Evaluation Capability in Language Models

Paper • 2310.08491 • Published Oct 12, 2023 • 53