التقطيع
التقطيع هو عملية تقسيم المستندات المصدرية إلى وحدات استرجاع أصغر قبل تضمينها. يحدد حجم المقطع واستراتيجية الحدود مدى دقة المُسترجِع في تحديد موضع حقيقة ذات صلة، موازنًا بين الاستدعاء والدقة وتكلفة التضمين عبر قاعدة معرفية.
مرادفات: text chunking, document segmentation, passage splitting, chunk strategy
التقطيع هو الموضع الذي تُكسب فيه جودة الاسترجاع أو تُفقَد بصمت. قد تكون الاستراتيجية نافذة رموز ثابتة، أو نافذة منزلقة متداخلة، أو حدودًا تتبع البنية الدلالية كالعناوين والأقسام. يُضمَّن كل مقطع ويُفهرس مع بيانات وصفية — المصدر، اللغة، الطوابع الزمنية، تجزئة المحتوى — حتى يستطيع الاسترجاع التصفية وإزالة التكرار والتحديث تدريجيًا. ولأن كل إجابة لاحقة لا تتجاوز جودة المقطع الذي تسترجعه، فإن التقطيع المتعمَّد شرط مسبق للإجابات المؤسَّسة القابلة للاقتباس.