Version: 25.6

snorkelai.sdk.develop.PromptEvaluator

class snorkelai.sdk.develop.PromptEvaluator(*args, **kwargs)

Bases: Evaluator

An evaluator that uses LLM prompts to assess model outputs.

This evaluator type is known as an LLM-as-a-judge (LLMAJ). A prompt evaluator uses LLM prompts to evaluate datapoints containing AI application responses, categorizing them into one of a criteria’s labels by assigning the corresponding integer score and optional rationale.

Prompt evaluator execution via the SDK is not yet supported. Please use the GUI to run prompt evaluators.

Read more about LLM-as-a-judge prompts.

__init__(*args, **kwargs)

Methods

`__init__`(args, *kwargs)
`create`(criteria_uid, **kwargs)	Creates a new evaluator for a criteria.
`execute`(split[, num_rows])	Runs the evaluator against all datapoints in the specified dataset split.
`get`(evaluator_uid)	Retrieves the evaluator for a given uid.
`get_execution_result`(execution_uid)	Retrieves the evaluation results and scores for a specific execution.
`get_executions`()	Retrieves all executions for this evaluator.
`get_versions`()	Retrieves all version names for this evaluator.
`poll_execution_result`(execution_uid[, sync])	Polls the evaluation job status and retrieves partial results.
`update`(version_name, **kwargs)	Updates the evaluator with a new version.

Attributes

`benchmark_uid`
`criteria_uid`
`evaluator_uid`

create

classmethod create(criteria_uid, **kwargs)

Creates a new evaluator for a criteria.

Parameters Parameters
Return type Return type: PromptEvaluator

Name	Type	Default	Info
criteria_uid	`int`		The unique identifier of the criteria that this evaluator assesses.
**kwargs	`Any`		Additional parameters specific to the evaluator type.

execute

execute(split, num_rows=None, **kwargs)

Runs the evaluator against all datapoints in the specified dataset split.

Parameters Parameters
Return type Return type: int

Name	Type	Default	Info
split	`str`		The dataset split you want to evaluate.
num_rows	`Optional[int]`	`None`	The number of rows to evaluate. If `None`, evaluates all rows.
**kwargs	`Dict[str, Any]`		Additional parameters specific to the evaluator type.

get

classmethod get(evaluator_uid)

Retrieves the evaluator for a given uid.

Parameters Parameters
Return type Return type: PromptEvaluator

Name	Type	Default	Info
evaluator_uid	`int`		The unique identifier for the evaluator.

get_execution_result

get_execution_result(execution_uid)

Retrieves the evaluation results and scores for a specific execution.

Parameters Parameters
Return type Return type: Dict[str, Dict[str, Union[str, int, float, bool]]]

Name	Type	Default	Info
execution_uid	`int`		The unique identifier of the execution you want to get results for.

get_executions

get_executions()

Retrieves all executions for this evaluator.

Return type Return type: List[Dict[str, Any]]

get_versions

get_versions()

Retrieves all version names for this evaluator.

Return type Return type: List[str]

poll_execution_result

poll_execution_result(execution_uid, sync=False)

Polls the evaluation job status and retrieves partial results.

Parameters Parameters
Return type Return type: Tuple[str, Dict[str, Dict[str, Union[str, int, float, bool]]]]

Name	Type	Default	Info
execution_uid	`int`		The unique identifier of the execution you want to poll for.
sync	`bool`	`False`	Whether to wait for the job to complete.

update

update(version_name, **kwargs)

Updates the evaluator with a new version.

Parameters Parameters
Return type Return type: str

Name	Type	Default	Info
version_name	`str`		The name for the new version.
**kwargs	`Dict[str, Any]`		Additional parameters specific to the evaluator type.

\_\_init\_\_

__init__​

create

create​

Parameters

Parameters​

Return type

Return type​

execute

execute​

Parameters

Parameters​

Return type

Return type​

get

get​

Parameters

Parameters​

Return type

Return type​

get\_execution\_result

get_execution_result​

Parameters

Parameters​

Return type

Return type​

get\_executions

get_executions​

Return type

Return type​

get\_versions

get_versions​

Return type

Return type​

poll\_execution\_result

poll_execution_result​

Parameters

Parameters​

Return type

Return type​

update

update​

Parameters

Parameters​

Return type

Return type​

init

create

Parameters

Return type

execute

Parameters

Return type

get

Parameters

Return type

get_execution_result

Parameters

Return type

get_executions

Return type

get_versions

Return type

poll_execution_result

Parameters

Return type

update

Parameters

Return type