קורפוס העברית: מאגר חדש של שיחות בעברית דבורה

Translated title of the contribution: The Huji Corpus of Spoken Hebrew (Hujicorpus): A New Database of Hebrew Conversations

Research output: Contribution to journalArticlepeer-review

Abstract

מאמר זה מדווח על כינונו של קורפוס העברית הדבורה של האוניברסיטה העברית - קורפוס העברית. מאגר חדש זה מתעד שיחות יומיום בעברית בת-ימינו בין סטודנטים וסטודנטיות באוניברסיטה ובין בני משפחתם וחבריהם, שנערכו בטלפון או פנים אל פנים. חלקו הראשון של קורפוס העברית, שהועלה למרשתת והוא פתוח וזמין לכול, כולל את קובצי השמע של שיחות הטלפון ותעתיקים של חלקים נבחרים מתוך השיחות (huji-corpus.com). חלקו השני של המאגר, הנמצא בפיתוח, כולל קובצי וידאו ותעתיקים של שיחות שהתקיימו פנים אל פנים. מאמר זה מציג את הרקע להקמת המאגר והשיקולים המנחים בעיצובו, ואת שלבי ההכנה והתוצרים של חלקו הראשון. בסיום הדברים מוצגות התוכניות לפיתוח העתידי של קורפוס העברית. (מתוך המאמר)
Translated title of the contributionThe Huji Corpus of Spoken Hebrew (Hujicorpus): A New Database of Hebrew Conversations
Original languageHebrew
Pages (from-to)203-221
Number of pages19
Journalבלשנות עברית: כתב-עת לבלשנות עברית תיאורית, חישובית ויישומית
Volume77
StatePublished - 2024

IHP publications

  • IHP publications
  • Corpora (Linguistics)
  • Hebrew language -- Spoken Hebrew
  • Hebrew language, Modern

Cite this