Używamy analityki, aby ulepszać doświadczenie. Możesz zaktualizować swój wybór w dowolnym momencie.
Glosariusz
Definicje terminów ważnych przy budowaniu odpowiedzialnych systemów automatyzacji pracy z AI.
Answer Engine Optimization (AEO)
marketing
Answer engine optimization to praktyka strukturyzowania treści tak, aby silniki odpowiedzi AI i asystenci czatu mogli ją znaleźć, zacytować i dokładnie podsumować. Tam, gdzie SEO celuje w ranking linków, AEO celuje w sam syntetyzowany wynik, optymalizując jasne definicje, dane strukturalne i maszynowo czytelne pliki źródłowe.
Synonimy: AEO, generative engine optimization, GEO, optymalizacja wyszukiwania AI
Czym AEO różni się od SEO?
SEO optymalizuje stronę, aby zajmowała pozycję jako klikalny link na stronie wyników. AEO optymalizuje ją, aby została wybrana, zacytowana i przypisana w odpowiedzi generowanej przez AI, co nagradza precyzyjne definicje, dane strukturalne i czyste kanały maszynowo czytelne.
Jakie sygnały pomagają silnikowi odpowiedzi cytować stronę?
Pisanie od definicji, poprawne dane strukturalne schema.org, indeks llms.txt, znaczniki FAQ i stabilne kanoniczne URL-e ułatwiają silnikowi odpowiedzi pobranie i przypisanie treści.
Automatyzacja intake
platform
Automatyzacja intake to proces zamiany nieustrukturyzowanych przychodzących żądań w ustrukturyzowane, maszynowo czytelne rekordy bez ręcznego wprowadzania danych. Klasyfikuje żądanie, wyodrębnia ważne pola i kieruje wynik do workflow, aby praca mogła być spójnie obsłużona lub wykonana.
E-maile, wiadomości czatu, formularze internetowe, przesłane dokumenty i zsynchronizowane rekordy z połączonych systemów można znormalizować do tej samej ustrukturyzowanej formy dla downstreamowej obsługi.
Czy automatyzacja intake zastępuje ludzi?
Nie. Usuwa ciężar ręcznego wprowadzania danych i triage, aby ludzie koncentrowali się na wyjątkach wymagających osądu, zatwierdzeniach i decyzjach wysokiego ryzyka, które polityka kieruje do nich.
Chunking
ai
Chunking to proces dzielenia dokumentów źródłowych na mniejsze jednostki retrieval przed ich osadzeniem. Rozmiar chunka i strategia granic określają, jak precyzyjnie retriever może znaleźć istotny fakt, równoważąc recall, precyzję i koszt embeddingów w bazie wiedzy.
Synonimy: dzielenie tekstu na chunki, segmentacja dokumentów, dzielenie pasaży, strategia chunków
Co tworzy dobry chunk?
Dobry chunk jest semantycznie samowystarczalny, ma rozmiar, który nie przecina pojedynczego faktu granicą, i niesie stabilne metadane, aby można go było wiarygodnie filtrować, odświeżać i cytować.
Jak chunking wpływa na jakość odpowiedzi?
Zbyt duże chunki rozmywają trafność i marnują tokeny, a zbyt małe łamią kontekst i tracą znaczenie. Wybór granic bezpośrednio kształtuje recall oraz ugruntowanie generowanych odpowiedzi.
Cytowanie dowodów
ai
Cytowanie dowodów to praktyka dołączania weryfikowalnych odniesień źródłowych do każdej tezy wypowiadanej przez system AI. Każdy cytowany fragment prowadzi z powrotem do dokumentu, rekordu lub zasobu wiedzy, z którego pochodzi, aby osoba mogła potwierdzić ugruntowanie odpowiedzi przed zaufaniem jej albo podjęciem działania.
Synonimy: cytacja, atrybucja źródła, linkowanie dowodów, pochodzenie odpowiedzi
Co powinna zawierać cytacja?
Co najmniej identyfikator źródła i dokładny użyty fragment, najlepiej ze stabilnym linkiem i znacznikiem czasu, aby reviewerzy mogli potwierdzić, że dowód był aktualny w chwili wygenerowania odpowiedzi.
Dlaczego cytacje są niezbędne dla governowanej automatyzacji?
Cytacje czynią odpowiedź audytowalną. Bez nich automatyczna odpowiedź jest nierozliczalna, a z nimi reviewer może zweryfikować ugruntowanie, zaś ślad audytu może dowieść, jakie dowody napędzały decyzję.
Delegowanie agentowi
security
Delegowanie agentowi to kontrolowane nadanie ograniczonego zakresem i czasem uprawnienia agentowi AI do działania w imieniu użytkownika albo innego agenta. Delegacja dokładnie określa, które możliwości, tenanty i działania są dozwolone, dzięki czemu agent działa w jawnych, odwoływalnych i audytowalnych granicach.
Synonimy: delegowane uprawnienie, delegacja zakresowa, autoryzacja agenta, grant agenta
Co definiuje zakres delegacji?
Możliwości, z których agent może korzystać, tenant, w którym może działać, działania, które może proponować lub wykonywać, oraz termin wygaśnięcia, aby uprawnienie było wąskie, czasowe i odwoływalne.
Jak delegacja pozostaje rozliczalna?
Każde delegowane działanie jest przypisywane zarówno agentowi, jak i principalowi delegującemu, oraz zapisywane w śladzie audytu, a działania wrażliwe nadal przechodzą przez politykę zatwierdzania.
Embedding
ai
Embedding to wektor liczbowy reprezentujący znaczenie tekstu, obrazów lub innych danych w przestrzeni wysokowymiarowej. Elementy o podobnym znaczeniu tworzą wektory leżące blisko siebie, co pozwala systemom porównywać, klastrować i pobierać treści według podobieństwa semantycznego zamiast dokładnych dopasowań.
Synonimy: embedding wektorowy, embedding tekstu, wektor semantyczny, gęsta reprezentacja
Dlaczego wersja modelu embeddingów ma znaczenie?
Wektory z różnych modeli nie są porównywalne. Przechowywanie wersji modelu przy każdym embeddingu pozwala wykrywać drift i bezpiecznie reindeksować po aktualizacji modelu embeddingów.
Czy embeddingi da się odwrócić do oryginalnego tekstu?
Nie dokładnie, ale embeddingi mogą ujawniać wrażliwe informacje, dlatego powinny dziedziczyć tę samą izolację tenantów i kontrolę dostępu co treść źródłowa, którą reprezentują.
Grounding
ai
Grounding to praktyka ograniczania wyniku modelu AI do weryfikowalnych dowodów źródłowych zamiast jego pamięci parametrycznej. Ugruntowana odpowiedź jest wspierana przez pobrane fragmenty, które można zacytować i sprawdzić, co jest podstawową obroną przed zmyślonymi lub pewnie błędnymi odpowiedziami.
Retrieval dostarcza modelowi tylko istotne fragmenty źródłowe, prompt instruuje go, aby odpowiadał z tych dowodów, a krok weryfikacji odrzuca twierdzenia bez wspierającej cytacji.
Co się dzieje, gdy nie ma dowodów do grounding?
Dobrze zaprojektowany system grounded odmawia odpowiedzi albo eskaluje do osoby, zamiast wymyślać odpowiedź, ujawniając jawny brak zamiast pewnej zgadywanki.
Halucynacja
ai
Halucynacja to pewny siebie, ale niewsparty lub zmyślony wynik modelu językowego, twierdzenie, które brzmi wiarygodnie, lecz nie ma podstawy w dostarczonych dowodach ani rzeczywistości. Halucynacje są głównym ryzykiem w automatyzacji pracy z wiedzą, a grounding z cytowanymi dowodami jest podstawową mitigacją.
Synonimy: halucynacja AI, fabrykacja, konfabulacja, nieugruntowany wynik
Dlaczego modele językowe halucynują?
Modele przewidują prawdopodobny tekst, a nie zweryfikowane fakty. Bez pobranych dowodów, które je ograniczają, wypełniają luki statystycznie wiarygodnymi, lecz niezweryfikowanymi stwierdzeniami.
Jak ograniczać halucynacje?
Ugruntuj odpowiedzi w pobranych źródłach, wymagaj cytacji, weryfikuj twierdzenia wobec dowodów i kieruj przypadki niskiej pewności lub bez wsparcia do osoby zamiast zwracać zgadywankę.
Human-in-the-Loop
governance
Human-in-the-loop to wzorzec projektowy, w którym ludzie przeglądają, zatwierdzają lub korygują propozycje systemu AI, zanim zaczną obowiązywać. Utrzymuje ludzki osąd na krytycznej ścieżce decyzji wysokiego ryzyka lub niskiej pewności, podczas gdy automatyzacja obsługuje rutynową skalę.
Synonimy: HITL, człowiek w pętli, nadzór człowieka, ludzki review
Kiedy krok powinien być human-in-the-loop?
Gdy decyzja jest wysokiego ryzyka, nieodwracalna, niskiej pewności lub regulowana polityką. Rutynowe, dobrze ugruntowane kroki niskiego ryzyka mogą działać automatycznie, a człowiek przegląda wyjątki.
Czym to się różni od pełnej automatyzacji?
Pełna automatyzacja działa bez review. Human-in-the-loop wstawia jawny punkt kontrolny, w którym osoba może zatwierdzić, edytować albo odrzucić propozycję, zachowując rozliczalność wrażliwych wyników.
Izolacja tenantów
security
Izolacja tenantów to gwarancja, że dane i konfiguracja każdego klienta w systemie multi-tenant pozostają logicznie oddzielone i niedostępne dla innych tenantów. Jest egzekwowana na każdej warstwie, w storage, retrieval i kontroli dostępu, aby jedna organizacja nigdy nie widziała ani nie wpływała na pracę innej.
Synonimy: izolacja multi-tenant, scoping tenanta, partycjonowanie danych, granica tenancy
Jak izolacja tenantów jest egzekwowana podczas retrieval?
Każde zapytanie jest ograniczone do tenanta żądającego, a przechowywana treść niesie identyfikator tenanta, więc vector i keyword search mogą zwrócić tylko dowody należące do tego tenanta.
Czy izolacja dotyczy tylko danych?
Nie. Obejmuje również konfigurację, politykę, embeddingi i logi audytu, więc żaden aspekt pracy jednego tenanta nie przecieka do innego, nawet na współdzielonej infrastrukturze.
Klasyfikacja intencji
ai
Klasyfikacja intencji to krok, który ustala, o co naprawdę prosi przychodzące żądanie, mapując nieustrukturyzowany tekst na zdefiniowaną kategorię pracy. Dokładna klasyfikacja kieruje każdy WorkItem do właściwego workflow, źródeł dowodów i polityki, czyniąc ją fundamentem niezawodnej automatyzacji.
Decyduje o całej downstreamowej ścieżce. Błędnie sklasyfikowane żądanie pobiera złe dowody i stosuje złą politykę, więc dokładność klasyfikacji wyznacza jakość wszystkiego, co następuje.
Jak mierzy się dokładność klasyfikacji?
Przez bramki ewaluacyjne na oznaczonym zbiorze, śledząc precision i recall dla każdej intencji oraz obserwując pomyłki między podobnymi kategoriami, zanim workflow wejdzie na produkcję.
Model Context Protocol (MCP)
ai
Model Context Protocol to otwarty standard, który pozwala asystentom AI łączyć się z zewnętrznymi narzędziami i źródłami danych przez jednolity interfejs. Serwer MCP udostępnia typowane narzędzia i zasoby, które klient modelu może odkrywać i wywoływać, więc możliwości można dodawać bez osobnego kodu dla każdej integracji.
Synonimy: MCP, model context protocol, serwer MCP, protokół narzędzi
Co udostępnia serwer MCP?
Typowane narzędzia, które model może wywołać, oraz zasoby, które może czytać, każde opisane schematem i adnotacjami, aby klient mógł bezpiecznie odkrywać możliwości i je wywoływać.
Dlaczego MCP ma znaczenie dla governowanej automatyzacji?
Daje zewnętrznym asystentom standardowy, opisany schematem sposób działania na platformie, dzięki czemu wywołania narzędzi można walidować, ograniczać do tenanta i kierować przez tę samą politykę zatwierdzania co każde inne działanie.
MongoDB Vector Search
infrastructure
Proces przekształcania treści w embeddingi wektorowe i przechowywania ich w indeksach wektorowych MongoDB Atlas Search z metadanymi, aby umożliwić wydajne wyszukiwanie podobieństwa.
Dlaczego używać MongoDB Atlas Search do retrieval wiedzy?
MongoDB Atlas Search zapewnia szybkie wyszukiwanie podobieństwa wektorowego z możliwością łączenia zapytań wektorowych i tradycyjnych, zintegrowane filtrowanie metadanych oraz płynne skalowanie w istniejącej infrastrukturze MongoDB.
Jakie metadane mają znaczenie?
Przechowuj ID tenanta, język, URL, hash treści, znacznik czasu aktualizacji i wersję modelu, aby umożliwić filtrowanie, kontrole świeżości i kontrolowane reindeksowanie.
Naruszenie SLA
operations
Naruszenie SLA występuje, gdy praca nie dotrzymuje zobowiązania zdefiniowanego w service-level agreement, takiego jak termin odpowiedzi lub rozwiązania. Automatyczne wykrywanie i eskalowanie naruszeń utrzymuje widoczną rozliczalność i zapewnia, że praca zagrożona trafia do właściwych osób, zanim zobowiązania zostaną przekroczone.
Synonimy: naruszenie poziomu usługi, złamanie SLA, niedotrzymane SLA, naruszenie terminu
Jak automatycznie wykrywa się naruszenia SLA?
Każdy WorkItem niesie własne timery zobowiązań, a system obserwuje upływ czasu względem progów, podnosząc eskalacje, gdy termin się zbliża, i zapisując naruszenie, jeśli zostanie przekroczony.
Co się dzieje, gdy naruszenie jest bliskie?
Polityka może eskalować WorkItem, powiadomić właścicieli albo zmienić priorytet kolejki, aby uwaga przesunęła się na pracę zagrożoną, zanim zobowiązanie zostanie faktycznie niedotrzymane.
Pack wertykalny
platform
Pack wertykalny to spakowana konfiguracja dostosowująca platformę do konkretnej domeny pracy, jej intencji, pól ekstrakcji, źródeł dowodów, polityk i działań. Packi pozwalają zespołowi uruchomić skoncentrowany workflow, taki jak dostęp IT albo vendor security, bez przebudowywania bazowego silnika.
Intencje, które rozpoznaje, pola, które wyodrębnia, dowody, na których ugruntowuje odpowiedzi, polityki zatwierdzania, które egzekwuje, oraz governowane działania, które może proponować dla tej domeny pracy.
Czy packi można dostosować?
Tak. Pack jest konfiguracją startową, którą zespoły adaptują w Studio, dostosowując intencje, prompty, źródła dowodów i polityki, aby pasował do ich realnych procesów.
Pakiet pracy
platform
Pakiet pracy to wiązka kontekstu zebrana wokół WorkItem, aby można było o nim rozumować i działać: pierwotne żądanie, wyodrębnione pola, pobrane dowody, właściwa polityka i wszelkie proponowane działania. To kompletna, samowystarczalna odprawa dla jednego fragmentu pracy.
Synonimy: wiązka pracy, pakiet kontekstu, pakiet zadania, kontekst pracy
Czym pakiet pracy różni się od WorkItem?
WorkItem jest śledzonym rekordem samego żądania. Pakiet pracy to zebrany kontekst, dowody, polityka i propozycje, zgromadzone wokół tego rekordu, aby napędzać odpowiedź lub działanie.
Dlaczego wiązać kontekst w pakiet?
Samowystarczalny pakiet pozwala modelowi lub reviewerowi podjąć decyzję bez szukania po systemach, i zachowuje dokładnie to, jakie dowody były dostępne w chwili decyzji dla śladu audytu.
Propozycja działania
platform
Propozycja działania to ustrukturyzowana, możliwa do przeglądu sugestia zmiany w połączonym systemie biznesowym, utworzona przez automatyzację, ale jeszcze niewykonana. Wskazuje system docelowy, operację i dokładne parametry, aby osoba lub polityka mogła ją zatwierdzić, edytować albo odrzucić, zanim cokolwiek się wydarzy.
Synonimy: proponowane działanie, sugestia działania, szkic działania, oczekujące działanie
Dlaczego proponować działanie zamiast od razu je wykonać?
Propozycja najpierw oddziela zamiar od skutku. Pozwala polityce zatwierdzania i reviewerom sprawdzić dokładną operację oraz parametry, zapobiegając temu, by automatyczny błąd trafił do systemu ewidencji.
Co zawiera propozycja działania?
Integrację docelową, operację do wykonania, rozwiązane parametry, wspierające dowody oraz decyzję polityki o tym, czy przed wykonaniem wymagana jest akceptacja.
Protokół Agent2Agent (A2A)
ai
Protokół Agent2Agent to otwarty standard, dzięki któremu autonomiczne agenty mogą się wzajemnie odkrywać, wymieniać zadania i koordynować pracę ponad granicami organizacji. Definiuje, jak agent ogłasza swoje możliwości oraz jak inny agent deleguje zadanie i śledzi je do zakończenia.
MCP łączy model z narzędziami i danymi. A2A łączy agentów ze sobą, definiując, jak jeden agent przekazuje zadanie drugiemu i śledzi jego status, zamiast tego, jak model wywołuje pojedyncze narzędzie.
Jak śledzi się zadania A2A?
Zadanie A2A mapuje się na śledzony rekord pracy, więc jego cykl życia, dowody i wynik są audytowalne, tak jak praca pochodząca od osoby lub formularza.
Retrieval hybrydowy
ai
Retrieval hybrydowy łączy semantyczny vector search z leksykalnym keyword search, aby pobierać istotne fragmenty. Vector search wychwytuje znaczenie i parafrazę, keyword search wychwytuje dokładne terminy i identyfikatory, a krok fusion łączy oba zbiory wyników, aby nie zgubić ani precyzyjnych tokenów, ani dopasowań pojęciowych.
Vector search może przeoczyć rzadkie dokładne terminy, takie jak SKU lub kody błędów, a keyword search przeoczy parafrazy. Fusion odzyskuje mocne strony obu i podnosi recall na rzeczywistych zapytaniach.
Jak łączy się oba zbiory wyników?
Metoda fusion, taka jak reciprocal rank fusion albo ważona mieszanka wyników, ponownie szereguje połączonych kandydatów, często z następnym rerankerem cross-encoder dla końcowej precyzji.
Retrieval-Augmented Generation (RAG)
ai
Retrieval-augmented generation to technika, która ugruntowuje wynik modelu językowego w pobranych dokumentach źródłowych zamiast polegać wyłącznie na jego pamięci parametrycznej. System pobiera istotne fragmenty z bazy wiedzy, podaje je jako kontekst i prosi model, aby odpowiadał wyłącznie na podstawie tych dowodów.
RAG utrzymuje wiedzę w zewnętrznym magazynie, który można natychmiast aktualizować, więc odpowiedzi pozostają aktualne, a każdą tezę można prześledzić do źródła. Fine-tuning wpisuje wiedzę w wagi, co wolniej się odświeża i trudniej atrybuuje.
Co obejmuje pipeline RAG?
Zwykle ingest i chunking, embedding, indeks dla vector lub hybrid search, retriever oraz krok generowania, który warunkuje model pobranymi fragmentami i zwraca cytowane dowody.
Single Sign-On (SSO)
security
Metoda uwierzytelniania, która pozwala użytkownikom uzyskiwać dostęp do wielu aplikacji jednym zestawem danych logowania przez protokoły federacji tożsamości, takie jak SAML lub OpenID Connect.
Dlaczego SSO ma znaczenie dla platform shell-and-pack?
Centralizuje tożsamość, egzekwuje polityki bezpieczeństwa enterprise, takie jak MFA i conditional access, oraz przyspiesza provisioning użytkowników w shellach, packach i governowanych workspace'ach.
SAML kontra OIDC?
SAML jest oparty na XML i powszechny w starszych stosach enterprise; OIDC, zbudowany na OAuth2, jest lżejszy i nowoczesny. Obsługa obu maksymalizuje zgodność z IdP klientów.
Vector Search
ai
Vector search znajduje treści według znaczenia, a nie dokładnych słów. Tekst jest przekształcany w embeddingi wysokowymiarowe, a metryka podobieństwa, taka jak odległość kosinusowa, szereguje zapisane wektory według bliskości do wektora zapytania, zwracając pojęciowo powiązane fragmenty nawet bez pasujących słów kluczowych.
Embedding to wektor liczbowy reprezentujący znaczenie fragmentu tekstu, wytworzony przez model embeddingów. Teksty o podobnym znaczeniu trafiają blisko siebie w przestrzeni wektorowej.
Czym jest approximate nearest neighbor (ANN) search?
ANN search wymienia niewielką część dokładności na duży wzrost szybkości, używając struktur indeksu, aby lookup podobieństwa pozostawał szybki, gdy liczba zapisanych wektorów rośnie do milionów.
Workflow zatwierdzania
governance
Workflow zatwierdzania to governowana sekwencja punktów kontrolnych, przez które proponowane działanie musi przejść przed wykonaniem. Każdy krok kieruje decyzję do właściwego reviewera na podstawie ryzyka, roli lub polityki, zapisując, kto co zatwierdził, aby wynik był w pełni rozliczalny.
Synonimy: przepływ zatwierdzania, workflow review, workflow autoryzacji, proces akceptacji
Co może uruchomić wymóg zatwierdzenia?
Wymogi można stosować według workflow, kanału, klasy ryzyka, progu kwotowego lub typu działania, więc tylko kroki rzeczywiście wymagające nadzoru zatrzymują się dla reviewera.
Jak workflow zatwierdzania pozostaje audytowalny?
Każde żądanie, zatwierdzenie, edycja i odrzucenie są zapisywane z aktorem i znacznikiem czasu, tworząc ślad end-to-end, który dowodzi, kto autoryzował każde governowane działanie.
WorkItem
platform
WorkItem to jednostka pracy w Threada: pojedyncze przychodzące żądanie, z e-maila, czatu, dokumentu lub formularza, znormalizowane do ustrukturyzowanego, śledzalnego rekordu. Każdy WorkItem niesie swoją intencję, wyodrębnione pola, dowody i pełną historię każdej decyzji oraz działania.
Synonimy: work item, rekord zadania, śledzone żądanie, jednostka pracy
Czym WorkItem różni się od zgłoszenia supportowego?
Ticket zwykle śledzi rozmowę. WorkItem śledzi samą pracę: zaklasyfikowaną intencję, wyodrębnione pola, dowody ugruntowujące każdą odpowiedź i podjęte governowane działania, wszystko audytowalne end-to-end.
Przez jaki cykl życia przechodzi WorkItem?
Intake normalizuje żądanie, klasyfikacja intencji je kieruje, retrieval dowodów ugruntowuje proponowaną odpowiedź, a każde działanie przechodzi przez politykę zatwierdzania, zanim WorkItem zostanie rozwiązany i zapisany.