Create README.md
Browse files
README.md
ADDED
@@ -0,0 +1,26 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
datasets:
|
3 |
+
- techiaith/cofnodycynulliad_en-cy
|
4 |
+
language:
|
5 |
+
- cy
|
6 |
+
---
|
7 |
+
|
8 |
+
Mae'r model LLM yn seiliedig ar [BangorAI/mistral-7b-cy-tokenizer-train-6](https://huggingface.co/BangorAI/mistral-7b-cy-tokenizer-train-6), sef y model Mistral-7B, gyda estyniad yn y tocynnydd ac hyfforddiant parhaus ar gyfer y Gymraeg.
|
9 |
+
|
10 |
+
Cafodd y model hyfforddiant cywrain pellach ar ddata Cofnod y Cynulliad a ddarparir gan [TechIaith](https://huggingface.co/techiaith).
|
11 |
+
|
12 |
+
|
13 |
+
### Fformat Sgwrs
|
14 |
+
|
15 |
+
Mae'r hyfforddiant cywrain wedi defnyddio'r fformat canlynol ar gyfer trosi o'r Saesneg i'r Gymraeg (a'r naill ffordd i'r llall).
|
16 |
+
```
|
17 |
+
Cyfieithwch y testun Saesneg canlynol i'r Gymraeg.
|
18 |
+
### Saesneg:
|
19 |
+
{prompt}
|
20 |
+
|
21 |
+
### Cymraeg:
|
22 |
+
|
23 |
+
```
|
24 |
+
|
25 |
+
## Hawlfraint
|
26 |
+
Mae'r data Cofnod y Cynulliad dan drywdded [Llywodraeth Agored](https://www.nationalarchives.gov.uk/doc/open-government-licence-cymraeg/version/3/).
|