mtma / wiki-arabic-full

wiki_arabic_full

تم التحديث منذ يومين

جاري جلب البيانات...
بطاقة البيانات (README)
اسم المصدر (Source Name): Arabic Wikipedia (ويكيبيديا العربية). المعرف البرمجي (Hugging Face ID): wikimedia/wikipedia نسخة الإصدار (Config/Version): 20231101.ar (تحديث 1 نوفمبر 2023). نوع البيانات (Type): نصوص معرفية عامة (General Knowledge / Encyclopedic Text). اللغة (Language): العربية الفصحى الحديثة (Modern Standard Arabic - MSA). عدد المقالات (Size): حوالي 1.22 مليون مقال/سجل (كما ظهر في صورتك). صيغة الحفظ (Format): Apache Arrow / Parquet (محفوظة عبر مكتبة datasets).
Installation
$ pip install oneurai
تم النسخ
download.py
from oneurai import load_dataset
import os

# اسم الداتا ست
repo_id = "mtma/wiki-arabic-full"

print("🚀 Starting the download process...")

dataset_path = load_dataset(repo_id)

if dataset_path:
    print(f"\n✅ تمت العملية بنجاح!")
    print(f"📂 مسار البيانات: {dataset_path}")
else:
    print("\n❌ فشل التحميل.")
تم نسخ الكود بنجاح!

نظرة عامة

التحميلات 7
الحجم 2.91 GB
نوع المهمة Text Classification
MTMA
ناشر معتمد