19 packages found

vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

amd
cuda
deepseek
gpt
hpu
inference
inferentia
llama
llm
llm-serving
llmops
mlops
model-serving
pytorch
qwen
rocm
tpu
trainium
transformer
xpu

io.ray:streaming-api

ray streaming api

data-science
deep-learning
deployment
distributed
hyperparameter-optimization
hyperparameter-search
large-language-models
llm
llm-inference
llm-serving
machine-learning
optimization
parallel
python
pytorch
ray
reinforcement-learning
rllib
serving
tensorflow

io.ray:ray-serve

java for ray serve

data-science
deep-learning
deployment
distributed
hyperparameter-optimization
hyperparameter-search
large-language-models
llm
llm-inference
llm-serving
machine-learning
optimization
parallel
python
pytorch
ray
reinforcement-learning
rllib
serving
tensorflow

vllm-npu

A high-throughput and memory-efficient inference and serving engine for LLMs

amd
cuda
deepseek
gpt
hpu
inference
inferentia
llama
llm
llm-serving
llmops
mlops
model-serving
pytorch
qwen
rocm
tpu
trainium
transformer
xpu

ant-ray

Ray provides a simple, universal API for building distributed applications.

ray
distributed
parallel
machine-learning
hyperparameter-tuningreinforcement-learning
deep-learning
serving
python
data-science
deployment
hyperparameter-optimization
hyperparameter-search
large-language-models
llm
llm-inference
llm-serving
optimization
pytorch
reinforcement-learning
rllib
tensorflow

vllm-online

A high-throughput and memory-efficient inference and serving engine for LLMs

amd
cuda
deepseek
gpt
hpu
inference
inferentia
llama
llm
llm-serving
llmops
mlops
model-serving
pytorch
qwen
rocm
tpu
trainium
transformer
xpu

secretflow-ray

Ray provides a simple, universal API for building distributed applications.

ray
distributed
parallel
machine-learning
hyperparameter-tuningreinforcement-learning
deep-learning
serving
python
data-science
deployment
hyperparameter-optimization
hyperparameter-search
large-language-models
llm
llm-inference
llm-serving
optimization
pytorch
reinforcement-learning
rllib
tensorflow

ray

Ray provides a simple, universal API for building distributed applications.

ray
distributed
parallel
machine-learning
hyperparameter-tuningreinforcement-learning
deep-learning
serving
python
data-science
deployment
hyperparameter-optimization
hyperparameter-search
large-language-models
llm
llm-inference
llm-serving
optimization
pytorch
reinforcement-learning
rllib
tensorflow

ray-cpp

A subpackage of Ray which provides the Ray C++ API.

ray
distributed
parallel
machine-learning
hyperparameter-tuningreinforcement-learning
deep-learning
serving
python
data-science
deployment
hyperparameter-optimization
hyperparameter-search
large-language-models
llm
llm-inference
llm-serving
optimization
pytorch
reinforcement-learning
rllib
tensorflow

bentoml

BentoML: The easiest way to serve AI apps and models

BentoML
Compound
AI
Systems
LLMOps
MLOps
Model
Deployment
Inference
Serving
ai-inference
deep-learning
generative-ai
inference-platform
llm
llm-inference
llm-serving
machine-learning
ml-engineering
model-inference-service
model-serving
multimodal
python

Showing 1 to 10 of 19 results