Infrastruttura di traduzione per il era dell'agente
La maggior parte delle API di traduzione sono state progettate quando "traduzione" significava che un essere umano incollava un testo in un modulo web. FluentC è stato progettato per quello che la traduzione è ora: un agente che chiama un'API migliaia di volte all'ora, nel mezzo di un flusso di lavoro, aspettandosi una risposta prima che l'utente se ne accorga.
Quella modifica cambia tutto sotto l'API — come funziona la cache, come vengono gestiti i batch, come è strutturato il prezzo, come si comportano i limiti di velocità. Abbiamo ricostruito la pila intorno a esso.
Un prodotto. Alcune parti in movimento. Ecco il tour.
Ogni sezione collega a una pagina più approfondita se desideri la storia completa.
Un endpoint, tre formati di input, un UUID per l'autenticazione.
POST /ai_agent/translate gestisce testo, HTML e JSON. Selezioni il formato di input, la lingua di destinazione e se desidera ricevere la risposta in modo sincrono o come lavoro batch. Questa è l'intera superficie.
L'autenticazione è un singolo UUID nell'intestazione di autorizzazione. Nessuna scambio di token, nessuna libreria client richiesta per iniziare. curl funziona. n8n funziona. Uno strumento LangChain funziona. Qualunque cosa tu stia tenendo funziona.
curl -X POST https://api.fluentc.io/ai_agent/translate \ -H "Authorization: 4f3a-uuid-...-9c2e" \ -H "Content-Type: application/json" \ -d '{ "input_format": "json", "target_language": "es", "mode": "sync", "content": { "title": "Hello", "body": "Welcome" } }' # 204ms · 200 OK { "translation": { "title": "Hola", "body": "Bienvenido" }, "target_language": "es", "tm_hit": false, "request_id": "tx_8f3a72c4" }
Per quando un agente è a metà conversazione e ha bisogno della risposta subito.
Richiesta sincrona, testo tradotto nella risposta, nessun polling.
Dietro le quinte c'è una cache indirizzata al contenuto basata su chiavi SHA256(target_language + input)La seconda volta che la stessa stringa passa, si salta completamente il modello — stessa traduzione, stessa chiave, risposta più veloce.
Questo conta più di quanto sembri dovrebbe. Un chatbot multilingue che risponde ciao in dodici lingue colpirà costantemente quella cache
Per quando hai 50.000 righe e ne hai bisogno tutte in una volta.
Invia il lavoro, ottieni un job_id indietro, chiedi i risultati quando sei pronto. Funziona per un foglio Google, un catalogo di prodotti, una directory di file JSON i18n — qualsiasi cosa.
JSON viene gestito correttamente: le strutture annidate vengono attraversate, ogni valore stringa viene tradotto indipendentemente e in parallelo, e la forma originale viene ricomposta alla fine. Le chiavi rimangono chiavi. La struttura rimane struttura.
Lo stesso job_id è sicuro votare per sempre — è un hash deterministico del tuo input, non un biglietto casuale. Rimanda lo stesso contenuto e otterrai lo stesso job_id e lo stesso risultato memorizzato nella cache.
Paga una volta per "Aggiungi al carrello". Per sempre.
La memoria di traduzione è un database di traduzioni per cui hai già pagato. La prossima volta che la stessa stringa passa, non paghi di nuovo — e la risposta è più veloce perché non raggiunge il modello.
La maggior parte delle API di traduzione ti addebita per carattere ogni volta. Non lo facciamo. Per i cataloghi di ecommerce, supporta le macro e qualsiasi prodotto con stringhe ripetitive, questa è la fonte principale di risparmio.
Puoi anche sovrascrivi traduzioni specifiche su base per sito quando desideri una resa diversa da quella predefinita dal modello La cache rispetta le tue sovrascritture.
Il catalogo che ti aspetteresti, limitato all'agente che sta chiedendo.
Le principali lingue europee, le principali lingue asiatiche, arabo, ebraico, hindi e le lingue meno diffuse oltre a queste.
L'elenco è memorizzato nella cache ed esposto a GET /ai_agent/languages, limitato a ciò che hai abilitato sul tuo agente.
Aggiungi o rimuovi lingue dalla tua dashboard. Ogni agente ha il proprio set abilitato — quindi un agente Shopify che traduce in dieci lingue e un agente di supporto interno che traduce in tre possono convivere nello stesso account.
Cinque cose che vale la pena sapere se stai valutando.
Input identico + lingua di destinazione è un colpo di cache. Nessuna sorpresa di "corrispondenza approssimativa", nessun addebito per chiamata ripetuta di stringhe.
La ri-invio dello stesso batch di input restituisce lo stesso job_id. Idempotente per progettazione.
I lavori di traduzione di background riprovano in caso di timeout del modello (5 tentativi, backoff esponenziale) e limiti di velocità (10 tentativi, rispettando Retry-After). Non devi costruirlo tu stesso.
Un documento con 200 valori di stringa non esegue 200 chiamate di modello sequenziali — si espande e si riassembla.
L'intera API è raggiungibile tramite curl. Esistono SDK se li desideri; non sono un prerequisito.
La specifica OpenAPI è pubblicata su /ai_agent/swagger.yml e i documenti interattivi a /ai_agent/docs.