mtma / arabic-news-summarization

Arabic News Summarization

تم التحديث منذ أسبوعين

جاري جلب البيانات...
بطاقة البيانات (README)
# 📝 Arabic News Summarization | تلخيص الأخبار العربية ## 📄 Dataset Summary A large-scale dataset for **Arabic Text Summarization**, containing hundreds of thousands of news articles paired with their summaries. This dataset is pre-processed and stored in **Parquet format** for immediate use. مجموعة بيانات ضخمة مخصصة لمهام "تلخيص النصوص". تحتوي على مقالات إخبارية عربية متنوعة مع ملخصاتها، وهي مثالية لتدريب نماذج الذكاء الاصطناعي على اختصار النصوص الطويلة واستخراج النقاط الرئيسية. ## 📊 Dataset Details * **Task:** Summarization. * **Format:** Parquet. * **Language:** Arabic (`ar`). * **Content:** News Articles & Summaries. ## 🛠 Usage Used to train Abstractive Summarization models (like BERT, T5, and BART) for Arabic.
Installation
$ pip install oneurai
تم النسخ
download.py
from oneurai import load_dataset
import os

# اسم الداتا ست
repo_id = "mtma/arabic-news-summarization"

print("🚀 Starting the download process...")

dataset_path = load_dataset(repo_id)

if dataset_path:
    print(f"\n✅ تمت العملية بنجاح!")
    print(f"📂 مسار البيانات: {dataset_path}")
else:
    print("\n❌ فشل التحميل.")
تم نسخ الكود بنجاح!

نظرة عامة

التحميلات 0
الحجم 622.66 MB
نوع المهمة Text Classification
MTMA
ناشر معتمد