Question 1

What is the cost of llama-3_2-nemoretriever-300m-embed-v1 by Nvidia?

Accepted Answer

llama-3_2-nemoretriever-300m-embed-v1 by Nvidia costs Free per 1M input tokens and Free per 1M output tokens.

Question 2

What is the context window of llama-3_2-nemoretriever-300m-embed-v1 by Nvidia?

Accepted Answer

llama-3_2-nemoretriever-300m-embed-v1 by Nvidia has a context window of 33K tokens. It supports up to 33K input tokens and can generate up to 2K output tokens.

Question 3

What input and output types does llama-3_2-nemoretriever-300m-embed-v1 support?

Accepted Answer

llama-3_2-nemoretriever-300m-embed-v1 by Nvidia accepts text as input and can generate text as output.

Question 4

Is llama-3_2-nemoretriever-300m-embed-v1 by Nvidia open source?

Accepted Answer

Yes, llama-3_2-nemoretriever-300m-embed-v1 by Nvidia has open weights, meaning the model weights are publicly available for download and self-hosting.

llama-3_2-nemoretriever-300m-embed-v1 API

Input Modalities

Output Modalities

Standard (per 1M tokens)

llama-3_2-nemoretriever-300m-embed-v1 API

Input Modalities

Output Modalities

Standard (per 1M tokens)