Class API

Managed Inference API.

This API allows you to handle your Managed Inference services.

Hierarchy

API
- API

Index

Constructors

constructor

new API(client: Client): Inference.v1.API
Parameters
- client: Client
Returns Inference.v1.API
Inherited from ParentAPI.constructor
- Defined in packages/clients/src/scw/api.ts:9

Properties

`Static` `Readonly`LOCALITIES

LOCALITIES: Region[] = ...

Lists the available regions of the API.

Methods

createDeployment

createDeployment(
request: Readonly<Inference.v1.CreateDeploymentRequest>,
): Promise<Inference.v1.Deployment>
Create a deployment. Create a new inference deployment related to a specific model.
Parameters
- request: Readonly<Inference.v1.CreateDeploymentRequest>
  The request CreateDeploymentRequest
Returns Promise<Inference.v1.Deployment>
A Promise of Deployment
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:140

createEndpoint

createEndpoint(
request: Readonly<Inference.v1.CreateEndpointRequest>,
): Promise<Inference.v1.Endpoint>
Create an endpoint. Create a new Endpoint related to a specific deployment.
Parameters
- request: Readonly<Inference.v1.CreateEndpointRequest>
  The request CreateEndpointRequest
Returns Promise<Inference.v1.Endpoint>
A Promise of Endpoint
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:210

createModel

createModel(
request: Readonly<Inference.v1.CreateModelRequest>,
): Promise<Inference.v1.Model>
Import a model. Import a new model to your model library.
Parameters
- request: Readonly<Inference.v1.CreateModelRequest>
  The request CreateModelRequest
Returns Promise<Inference.v1.Model>
A Promise of Model
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:325

deleteDeployment

deleteDeployment(
request: Readonly<Inference.v1.DeleteDeploymentRequest>,
): Promise<Inference.v1.Deployment>
Delete a deployment. Delete an existing inference deployment.
Parameters
- request: Readonly<Inference.v1.DeleteDeploymentRequest>
  The request DeleteDeploymentRequest
Returns Promise<Inference.v1.Deployment>
A Promise of Deployment
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:178

deleteEndpoint

deleteEndpoint(
request: Readonly<Inference.v1.DeleteEndpointRequest>,
): Promise<void>
Delete an endpoint. Delete an existing Endpoint.
Parameters
- request: Readonly<Inference.v1.DeleteEndpointRequest>
  The request DeleteEndpointRequest
Returns Promise<void>
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:247

deleteModel

deleteModel(request: Readonly<DeleteModelRequest>): Promise<void>
Delete a model. Delete an existing model from your model library.
Parameters
- request: Readonly<DeleteModelRequest>
  The request DeleteModelRequest
Returns Promise<void>
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:343

getDeployment

getDeployment(
request: Readonly<Inference.v1.GetDeploymentRequest>,
): Promise<Inference.v1.Deployment>
Get a deployment. Get the deployment for the given ID.
Parameters
- request: Readonly<Inference.v1.GetDeploymentRequest>
  The request GetDeploymentRequest
Returns Promise<Inference.v1.Deployment>
A Promise of Deployment
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:102

getDeploymentCertificate

getDeploymentCertificate(
request: Readonly<Inference.v1.GetDeploymentCertificateRequest>,
): Promise<Blob>
Get the CA certificate. Get the CA certificate used for the deployment of private endpoints. The CA certificate will be returned as a PEM file.
Parameters
- request: Readonly<Inference.v1.GetDeploymentCertificateRequest>
  The request GetDeploymentCertificateRequest
Returns Promise<Blob>
A Promise of Blob
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:194

getModel

getModel(
request: Readonly<Inference.v1.GetModelRequest>,
): Promise<Inference.v1.Model>
Get a model. Get the model for the given ID.
Parameters
- request: Readonly<Inference.v1.GetModelRequest>
  The request GetModelRequest
Returns Promise<Inference.v1.Model>
A Promise of Model
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:288

listDeployments

listDeployments(
    request?: Readonly<Inference.v1.ListDeploymentsRequest>,
): Promise<Inference.v1.ListDeploymentsResponse> & {
    "[asyncIterator]": () => AsyncGenerator<
        Inference.v1.Deployment[],
        void,
        void,
    >;
    all: () => Promise<Inference.v1.Deployment[]>;
}
List inference deployments. List all your inference deployments.
Parameters
- request: Readonly<Inference.v1.ListDeploymentsRequest> = {}
  The request ListDeploymentsRequest
Returns Promise<Inference.v1.ListDeploymentsResponse> & {
    "[asyncIterator]": () => AsyncGenerator<
        Inference.v1.Deployment[],
        void,
        void,
    >;
    all: () => Promise<Inference.v1.Deployment[]>;
}
A Promise of ListDeploymentsResponse
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:93

listModels

listModels(
    request?: Readonly<Inference.v1.ListModelsRequest>,
): Promise<Inference.v1.ListModelsResponse> & {
    "[asyncIterator]": () => AsyncGenerator<
        Inference.v1.Model[],
        void,
        void,
    >;
    all: () => Promise<Inference.v1.Model[]>;
}
List models. List all available models.
Parameters
- request: Readonly<Inference.v1.ListModelsRequest> = {}
  The request ListModelsRequest
Returns Promise<Inference.v1.ListModelsResponse> & {
    "[asyncIterator]": () => AsyncGenerator<
        Inference.v1.Model[],
        void,
        void,
    >;
    all: () => Promise<Inference.v1.Model[]>;
}
A Promise of ListModelsResponse
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:279

listNodeTypes

listNodeTypes(
    request: Readonly<Inference.v1.ListNodeTypesRequest>,
): Promise<Inference.v1.ListNodeTypesResponse> & {
    "[asyncIterator]": () => AsyncGenerator<
        Inference.v1.NodeType[],
        void,
        void,
    >;
    all: () => Promise<Inference.v1.NodeType[]>;
}
List available node types. List all available node types. By default, the node types returned in the list are ordered by creation date in ascending order, though this can be modified via the order_by field.
Parameters
- request: Readonly<Inference.v1.ListNodeTypesRequest>
  The request ListNodeTypesRequest
Returns Promise<Inference.v1.ListNodeTypesResponse> & {
    "[asyncIterator]": () => AsyncGenerator<
        Inference.v1.NodeType[],
        void,
        void,
    >;
    all: () => Promise<Inference.v1.NodeType[]>;
}
A Promise of ListNodeTypesResponse
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:374

updateDeployment

updateDeployment(
request: Readonly<Inference.v1.UpdateDeploymentRequest>,
): Promise<Inference.v1.Deployment>
Update a deployment. Update an existing inference deployment.
Parameters
- request: Readonly<Inference.v1.UpdateDeploymentRequest>
  The request UpdateDeploymentRequest
Returns Promise<Inference.v1.Deployment>
A Promise of Deployment
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:159

updateEndpoint

updateEndpoint(
request: Readonly<Inference.v1.UpdateEndpointRequest>,
): Promise<Inference.v1.Endpoint>
Update an endpoint. Update an existing Endpoint.
Parameters
- request: Readonly<Inference.v1.UpdateEndpointRequest>
  The request UpdateEndpointRequest
Returns Promise<Inference.v1.Endpoint>
A Promise of Endpoint
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:229

waitForDeployment

waitForDeployment(
request: Readonly<Inference.v1.GetDeploymentRequest>,
options?: Readonly<WaitForOptions<Inference.v1.Deployment>>,
): Promise<Inference.v1.Deployment>
Waits for Deployment to be in a final state.
Parameters
- request: Readonly<Inference.v1.GetDeploymentRequest>
  The request GetDeploymentRequest
- Optionaloptions: Readonly<WaitForOptions<Inference.v1.Deployment>>
  The waiting options
Returns Promise<Inference.v1.Deployment>
A Promise of Deployment
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:118

waitForModel

waitForModel(
request: Readonly<Inference.v1.GetModelRequest>,
options?: Readonly<WaitForOptions<Inference.v1.Model>>,
): Promise<Inference.v1.Model>
Waits for Model to be in a final state.
Parameters
- request: Readonly<Inference.v1.GetModelRequest>
  The request GetModelRequest
- Optionaloptions: Readonly<WaitForOptions<Inference.v1.Model>>
  The waiting options
Returns Promise<Inference.v1.Model>
A Promise of Model
- Defined in packages/clients/src/api/inference/v1/api.gen.ts:304

Class API

Hierarchy

Index

Constructors

Properties

Methods

Constructors

constructor

Parameters

Returns Inference.v1.API

Properties

Static ReadonlyLOCALITIES

Methods

createDeployment

Parameters

Returns Promise<Inference.v1.Deployment>

createEndpoint

Parameters

Returns Promise<Inference.v1.Endpoint>

createModel

Parameters

Returns Promise<Inference.v1.Model>

deleteDeployment

Parameters

Returns Promise<Inference.v1.Deployment>

deleteEndpoint

Parameters

Returns Promise<void>

deleteModel

Parameters

Returns Promise<void>

getDeployment

Parameters

Returns Promise<Inference.v1.Deployment>

getDeploymentCertificate

Parameters

Returns Promise<Blob>

getModel

Parameters

Returns Promise<Inference.v1.Model>

listDeployments

Parameters

Returns Promise<Inference.v1.ListDeploymentsResponse> & { "[asyncIterator]": () => AsyncGenerator< Inference.v1.Deployment[], void, void, >; all: () => Promise<Inference.v1.Deployment[]>;}

listModels

Parameters

Returns Promise<Inference.v1.ListModelsResponse> & { "[asyncIterator]": () => AsyncGenerator< Inference.v1.Model[], void, void, >; all: () => Promise<Inference.v1.Model[]>;}

listNodeTypes

Parameters

Returns Promise<Inference.v1.ListNodeTypesResponse> & { "[asyncIterator]": () => AsyncGenerator< Inference.v1.NodeType[], void, void, >; all: () => Promise<Inference.v1.NodeType[]>;}

updateDeployment

Parameters

Returns Promise<Inference.v1.Deployment>

updateEndpoint

Parameters

Returns Promise<Inference.v1.Endpoint>

waitForDeployment

Parameters

Returns Promise<Inference.v1.Deployment>

waitForModel

Parameters

Returns Promise<Inference.v1.Model>

Settings

On This Page

`Static` `Readonly`LOCALITIES

Returns Promise<Inference.v1.ListDeploymentsResponse> & {
"[asyncIterator]": () => AsyncGenerator<
Inference.v1.Deployment[],
void,
void,
>;
all: () => Promise<Inference.v1.Deployment[]>;
}

Returns Promise<Inference.v1.ListModelsResponse> & {
"[asyncIterator]": () => AsyncGenerator<
Inference.v1.Model[],
void,
void,
>;
all: () => Promise<Inference.v1.Model[]>;
}

Returns Promise<Inference.v1.ListNodeTypesResponse> & {
"[asyncIterator]": () => AsyncGenerator<
Inference.v1.NodeType[],
void,
void,
>;
all: () => Promise<Inference.v1.NodeType[]>;
}