AI21 Labs’ new AI model can handle more context than most

the AI industry is moving toward generative AI models with longer contexts

[{"selector":"#anim-951df294-4f0b-4f97-ac01-bcd02a2035d4 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

Contexts, or context windows, refer to input data that a model considers before generating output .

[{"selector":"#anim-59ed8851-d116-459c-ae14-931fd4619008 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(-3.4870250329948966%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

AI21 Labs’ Jamba, a new text-generating and -analyzing model, can perform many of the same tasks that models like OpenAI’s ChatGPT

[{"selector":"#anim-638693a3-75e9-4dc1-aff7-56b1e3fb3894 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(5.477242548246771%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

Jamba can handle up to 140,000 tokens while running on a single GPU with at least 80GB of memory

[{"selector":"#anim-76c48d1c-a3f4-41d3-895d-8164cbcd1a7b [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

Meta’s Llama 2, by comparison, has a 32,000-token context window — on the smaller side by today’s standards

[{"selector":"#anim-7991343f-5ff3-4734-a329-968a252a5d84 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

But what makes Jamba unique is what’s under the hood. It uses a combination of two model architectures

[{"selector":"#anim-e3cc7ae2-2240-4995-9806-f51f4a132ae8 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

Transformers are the architecture of choice for complex reasoning tasks, powering models like GPT-4 and Google’s Gemini

[{"selector":"#anim-e1c55cef-7ba9-4349-968d-e2233494d5d9 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(7.522717388350866%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

Jamba in fact uses Mamba as part of the core model — and Dagan claims it delivers three times the throughput on long contexts

[{"selector":"#anim-f0d6a3c1-1f15-4c04-8be1-0de395cb1fd0 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0.2722716738924582%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

while Jamba has been released under the Apache 2.0 license

[{"selector":"#anim-d2d2ac72-7e8e-4592-8cbd-87006fbba34f [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(-6.969895310512442%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

The model doesn’t have safeguards to prevent it from generating toxic text or mitigations to address potential bias;

[{"selector":"#anim-5d1d2661-bb5e-436b-bd2a-afc97675424f [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

See all Latest News from here

[{"selector":"#anim-293be689-ebb5-4035-a876-7aa82ef96eff [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(4.529296403171447%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]