Easy DataSet, büyük dil modeli ince ayar veri setleri oluşturmak için tasarlanmış bir uygulamadır. Kullanıcılar metin dosyaları yükleyebilir, sistem metni otomatik olarak böler ve sorular üretir, sonunda ince ayar için kullanılacak veri setleri oluşturur.
- Ön Uç Çerçevesi: Next.js 14 (App Router)
- UI Çerçevesi: Material-UI (MUI)
- Veri Depolama: Dosya sistemi simülasyonlu veritabanı
- Geliştirme Dili: JavaScript
easy-dataset/
├── app/ # Next.js uygulama dizini
│ ├── api/ # API yönlendirmeleri
│ │ └── projects/ # Proje ile ilgili API'ler
│ ├── projects/ # Proje ile ilgili sayfalar
│ │ ├── [projectId]/ # Proje detay sayfası
│ └── page.js # Ana sayfa
├── components/ # React bileşenleri
│ ├── home/ # Ana sayfa bileşenleri
│ │ ├── HeroSection.js
│ │ ├── ProjectList.js
│ │ └── StatsCard.js
│ ├── Navbar.js # Navigasyon çubuğu bileşeni
│ └── CreateProjectDialog.js
├── lib/ # Araç kütüphanesi
│ └── db/ # Veritabanı modülü
│ ├── base.js # Temel yardımcı fonksiyonlar
│ ├── projects.js # Proje yönetimi
│ ├── texts.js # Metin işleme
│ ├── datasets.js # Veri seti yönetimi
│ └── index.js # Modül dışa aktarımı
├── styles/ # Stil dosyaları
│ └── home.js # Ana sayfa stilleri
└── local-db/ # Yerel veritabanı dizini
- Temel dosya işlem fonksiyonları sağlar
- Veritabanı dizininin var olmasını sağlar
- JSON dosyası okuma/yazma yardımcı fonksiyonları
- Proje CRUD işlemleri
- Proje yapılandırma yönetimi
- Proje dizin yapısı bakımı
- Belge işleme fonksiyonları
- Metin parçası depolama ve geri alma
- Dosya yükleme işleme
- Veri seti oluşturma ve yönetim
- Soru listesi yönetimi
- Etiket ağacı yönetimi
- Üst navigasyon çubuğu
- Proje değiştirme
- Model seçimi
- Tema değiştirme
- HeroSection.js: Ana sayfa üst gösterim alanı
- ProjectList.js: Proje listesi gösterimi
- StatsCard.js: Veri istatistikleri gösterimi
- CreateProjectDialog.js: Proje oluşturma diyaloğu
- Proje listesi gösterimi
- Proje oluşturma giriş noktası
- Veri istatistikleri gösterimi
- text-split/: Belge işleme sayfası
- questions/: Soru listesi sayfası
- datasets/: Veri seti sayfası
- settings/: Proje ayarları sayfası
- projects/: Proje yönetimi API'si
- texts/: Metin işleme API'si
- questions/: Soru üretimi API'si
- datasets/: Veri seti yönetimi API'si
- Kullanıcı ana sayfadan veya navigasyon çubuğundan yeni proje oluşturur
- Proje temel bilgilerini doldurur (ad, açıklama)
- Sistem proje dizinini ve başlangıç yapılandırma dosyasını oluşturur
- Proje detay sayfasına yönlendirilir
- Kullanıcı Markdown dosyası yükler
- Sistem orijinal dosyayı proje dizinine kaydeder
- Metin bölme servisini çağırır, parçalar ve içindekiler yapısı oluşturur
- Bölme sonuçlarını ve çıkarılan içindekiler tablosunu gösterir
- Kullanıcı soru üretilecek metin parçalarını seçer
- Sistem büyük dil modeli API'sini çağırarak sorular üretir
- Soruları soru listesi ve etiket ağacına kaydeder
- Kullanıcı cevap üretilecek soruları seçer
- Sistem büyük dil modeli API'sini çağırarak cevaplar üretir
- Veri seti sonuçlarını kaydeder
- Dışa aktarma fonksiyonu sunar
Birden fazla büyük dil modeli sağlayıcı yapılandırması desteklenir:
- Ollama
- OpenAI
- SiliconFlow
- DeepSeek
- Zhipu AI
Her sağlayıcı için yapılandırılabilir:
- API adresi
- API anahtarı
- Model adı
- Daha fazla dosya formatı desteği (PDF, DOC vb.)
- Veri seti kalite değerlendirme fonksiyonu ekleme
- Veri seti sürüm yönetimi ekleme
- Takım işbirliği fonksiyonu uygulama
- Daha fazla veri seti dışa aktarma formatı ekleme
- Uluslararasılaştırma Kütüphanesi: i18next + react-i18next
- Dil Algılama: i18next-browser-languagedetector
- Desteklenen Diller: İngilizce (en), Basitleştirilmiş Çince (zh-CN), Türkçe (tr)
easy-dataset/
├── locales/ # Uluslararasılaştırma kaynak dizini
│ ├── en/ # İngilizce çeviriler
│ │ └── translation.json
│ ├── zh-CN/ # Çince çeviriler
│ │ └── translation.json
│ └── tr/ # Türkçe çeviriler
│ └── translation.json
├── lib/
│ └── i18n.js # i18next yapılandırması