Abstract
מאמר זה מדווח על כינונו של קורפוס העברית הדבורה של האוניברסיטה העברית - קורפוס העברית. מאגר חדש זה מתעד שיחות יומיום בעברית בת-ימינו בין סטודנטים וסטודנטיות באוניברסיטה ובין בני משפחתם וחבריהם, שנערכו בטלפון או פנים אל פנים. חלקו הראשון של קורפוס העברית, שהועלה למרשתת והוא פתוח וזמין לכול, כולל את קובצי השמע של שיחות הטלפון ותעתיקים של חלקים נבחרים מתוך השיחות (huji-corpus.com). חלקו השני של המאגר, הנמצא בפיתוח, כולל קובצי וידאו ותעתיקים של שיחות שהתקיימו פנים אל פנים. מאמר זה מציג את הרקע להקמת המאגר והשיקולים המנחים בעיצובו, ואת שלבי ההכנה והתוצרים של חלקו הראשון. בסיום הדברים מוצגות התוכניות לפיתוח העתידי של קורפוס העברית. (מתוך המאמר)
Translated title of the contribution | The Huji Corpus of Spoken Hebrew (Hujicorpus): A New Database of Hebrew Conversations |
---|---|
Original language | Hebrew |
Pages (from-to) | 203-221 |
Number of pages | 19 |
Journal | בלשנות עברית: כתב-עת לבלשנות עברית תיאורית, חישובית ויישומית |
Volume | 77 |
State | Published - 2024 |
IHP publications
- IHP publications
- Corpora (Linguistics)
- Hebrew language -- Spoken Hebrew
- Hebrew language, Modern