metadata

license: cc-by-4.0
datasets:
  - ddyuudd/chatbot_arena_ja_calm2-7b-chat-experimental
language:
  - ja
  - en

Model Card for "calm2-7b-chat-dpo-experimental"

Requirements, Usage, Chat Template

実験結果のランダム性を避けるため、greedy searchで出力しました。

calm2-7b-chat	calm2-7b-chat-dpo
2.67	2.85

以下の文をシステムプロンプト（system_message）としてcalm2-7b-chat-dpoとcalm2-7b-chatの評価を行いました。

"以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。"

このシステムプロンプトはstabilityai/japanese-stablelm-instruct-alpha-7bを評価するときに使われるものをそのまま使いました。他のデコーディングパラメータはデフォルトのままです（ランダム性があります）。

Yuu Jinnai (jinnai_yu@cyberagent.co.jp), Standing on the shoulders of giants