انتقل إلى المحتوى
مسرد

التقطيع

التقطيع هو عملية تقسيم المستندات المصدرية إلى وحدات استرجاع أصغر قبل تضمينها. يحدد حجم المقطع واستراتيجية الحدود مدى دقة المُسترجِع في تحديد موضع حقيقة ذات صلة، موازنًا بين الاستدعاء والدقة وتكلفة التضمين عبر قاعدة معرفية.

مرادفات: text chunking, document segmentation, passage splitting, chunk strategy

التقطيع هو الموضع الذي تُكسب فيه جودة الاسترجاع أو تُفقَد بصمت. قد تكون الاستراتيجية نافذة رموز ثابتة، أو نافذة منزلقة متداخلة، أو حدودًا تتبع البنية الدلالية كالعناوين والأقسام. يُضمَّن كل مقطع ويُفهرس مع بيانات وصفية — المصدر، اللغة، الطوابع الزمنية، تجزئة المحتوى — حتى يستطيع الاسترجاع التصفية وإزالة التكرار والتحديث تدريجيًا. ولأن كل إجابة لاحقة لا تتجاوز جودة المقطع الذي تسترجعه، فإن التقطيع المتعمَّد شرط مسبق للإجابات المؤسَّسة القابلة للاقتباس.

الأسئلة الشائعة

ما الذي يجعل المقطع جيدًا؟
المقطع الجيد قائم بذاته دلاليًا، وبحجم يمنع تقسيم حقيقة واحدة عبر الحدود، ويحمل بيانات وصفية مستقرة حتى يمكن تصفيته وتحديثه واقتباسه بموثوقية.
كيف يؤثر التقطيع على جودة الإجابة؟
المقاطع الكبيرة جدًا تُخفّف الصلة وتهدر الرموز، بينما المقاطع الصغيرة جدًا تُجزّئ السياق وتفقد المعنى. تشكّل خيارات الحدود مباشرةً الاستدعاء وتأسيس الإجابات المولَّدة.