محوّل الصوت إلى نص

تفريغ صوتي مجاني بالذكاء الاصطناعي: حوّل الكلام أو غناء الأغاني إلى نص. احصل على النص الكامل بالإضافة إلى ملفات SRT و VTT و LRC مزوّدة بالطوابع الزمنية. كشف تلقائي للغة وترجمة اختيارية إلى الإنجليزية.

ارفع ملف صوت أو فيديو واحصل على نص مفرَّغ نظيف، بالإضافة إلى ملفات ترجمة مزوّدة بالطوابع الزمنية (SRT و VTT) وملفات كلمات متزامنة (LRC). يعمل مع البودكاست والمقابلات والمحاضرات والاجتماعات والمذكرات الصوتية وغناء موسيقاك الخاصة. للمقاطع الموسيقية يوجد وضع مخصّص يعزل الغناء أولًا، فتظهر الكلمات أوضح بكثير مقارنةً بتمرير مزيج كامل إلى أداة التفريغ.

يعمل التفريغ على وحدة معالجة رسومات مدفوعة ويُموَّل بإعلانين قصيرين أو ثلاثة، ولا تشاهد إعلانات إلا عن الجزء الذي تختار تفريغه من الملف، وليس عن الملف كاملًا.

كيفية الاستخدام

انقر منطقة الرفع أو اسحب ملف صوت أو فيديو وأفلته (MP3 و WAV و OGG و FLAC و M4A و WebM و MP4؛ حتى 50 ميغابايت).
اختر الوضع. كلام / حديث يفرّغ الملف كما هو (حتى 10 دقائق)؛ أغنية / موسيقى يعزل الغناء أولًا (حتى 6 دقائق، وهذا يكلّف بضعة إعلانات إضافية بسبب الخطوة الزائدة).
إذا تجاوز الملف الحد المسموح في المرة الواحدة، اسحب العلامتين الخضراء والحمراء لاختيار المقطع الذي تريده. تساعدك أزرار «−1 ث / −10 ث / +1 ث / +10 ث» والمعاينة على ضبطه بدقة.
اختياريًا يمكنك تحديد لغة الكلام أو الغناء (أو تركها على الكشف التلقائي)، أو تفعيل «ترجمة النتيجة إلى الإنجليزية»، أو فتح الخيارات المتقدمة لإضافة تلميح سياقي (أسماء، مصطلحات، طريقة كتابة) وتشغيل أو إيقاف مرشّح الأسطر منخفضة الثقة.
اضغط تفريغ، وشاهد الإعلان أو الإعلانات القصيرة، فيظهر النص المفرَّغ.
فعّل إظهار الطوابع الزمنية للتبديل بين نص متصل وقائمة أسطر مزوّدة بالطوابع الزمنية، أو انسخ النص، أو نزّله بصيغة ‎.txt‎ أو ‎.srt‎ أو ‎.vtt‎ أو ‎.lrc‎. وفي وضع الأغنية تحصل أيضًا على الغناء المعزول لتنزيله أو إرساله إلى أداة أخرى.

الأسئلة الشائعة

ما الفرق بين وضع الكلام ووضع الأغنية؟ وضع الكلام يرسل اختيارك مباشرةً إلى نموذج تحويل الكلام إلى نص. وهو الأنسب للحديث: البودكاست والمقابلات والمحاضرات والمذكرات الصوتية. وضع الأغنية يفصل أولًا مسار الغناء عن الموسيقى ويفرّغ الغناء فقط، ما يعطي نتائج أنظف بكثير في الأغاني الكاملة. يُجري وضع الأغنية خطوة إضافية على وحدة المعالجة الرسومية، ولذلك فهو محدود بمدة أقصر ويستخدم بضعة إعلانات قصيرة إضافية.

ما صيغ الإخراج التي أحصل عليها؟ نص مفرَّغ عادي (‎.txt‎)، وترجمة بصيغة SubRip (‎.srt‎)، وترجمة بصيغة WebVTT (‎.vtt‎)، وملف LRC (‎.lrc‎) للكلمات المتزامنة. كلها تُبنى من النتيجة نفسها المزوّدة بالطوابع الزمنية، فيمكنك استخدام ما يتوقّعه محرّر الفيديو أو المشغّل أو تطبيق الكاريوكي لديك.

ما مدى دقّته، وما الذي يؤثّر فيها؟ يستخدم نموذج Whisper متطوّرًا. التسجيلات الواضحة والمتحدّث الواحد واللغات الشائعة تُفرَّغ على نحو أفضل. الضوضاء الخلفية القوية وتداخل المتحدّثين واللهجات الثقيلة أو الصوت منخفض معدّل البِت تقلّل الدقة. للأغاني، استخدم وضع الأغنية. إضافة تلميح سياقي في الخيارات المتقدمة (أسماء، مصطلحات تقنية، طريقة الكتابة المتوقّعة) قد تحسّن أسماء الأعلام بوضوح.

ماذا يحدث إذا لم يكن في الصوت كلام ولا غناء؟ تكتشف الأداة ذلك وتُظهر «لم يُكتشف كلام أو غناء» بدلًا من إرجاع نص مختلَق. كما يزيل خيار «حذف الأسطر منخفضة الثقة / غير الكلامية» (مفعّل افتراضيًا) الأسطر الزائفة التي تنتجها أحيانًا نماذج تحويل الكلام عند الصمت أو في المقاطع الموسيقية البحتة.

هل يستطيع كشف اللغة؟ هل يستطيع الترجمة؟ نعم. اترك اللغة على الكشف التلقائي وسيحدّدها (تُعرض اللغة المكتشَفة مع النتيجة). يمكنك أيضًا اختيار اللغة يدويًا، وتفعيل «ترجمة النتيجة إلى الإنجليزية» للحصول على نسخة إنجليزية إلى جانب الأصل.

لماذا توجد إعلانات، وهل هناك حد يومي؟ يعمل التفريغ (وعزل الغناء للأغاني) على وقت وحدة معالجة رسومية مستأجَر يكلّف مالًا حقيقيًا. إعلان قصير واحد لكل بضع دقائق من اختيارك يُبقي الأداة مجانية. ولمنع إساءة الاستخدام هناك حد أقصى لما يمكنك تفريغه يوميًا؛ فإذا بلغته فستظهر رسالة ويمكنك العودة لاحقًا.

هل تحتفظون بصوتي أو بنصّي المفرَّغ؟ لا. يُعالَج ملفك لهذا الطلب فقط ولا يُخزَّن لمدة طويلة، ويُعاد إليك النص المفرَّغ. لا يُنشَر ولا يُفهرَس ولا يُضاف إلى أي قاعدة بيانات. لا ترفع إلا صوتًا تملك حق تفريغه.