awslabs
diff --git a/‎pyproject.toml
+1-1 b/‎pyproject.toml
+1-1
diff --git a/‎src/rhubarb/analyze.py
+44-29 b/‎src/rhubarb/analyze.py
+44-29
diff --git a/‎src/rhubarb/invocations/invocations.py
+15-4 b/‎src/rhubarb/invocations/invocations.py
+15-4
diff --git a/‎src/rhubarb/models.py
+2 b/‎src/rhubarb/models.py
+2
@@ -1,6 +1,6 @@
 [tool.poetry]
 name = "pyrhubarb"
-version = "0.0.3"
+version = "0.0.4"
 description = "A Python framework for multi-modal document understanding with generative AI"
 authors = ["Rhubarb Developers <rhubarb-developers@amazon.com>"]
 license = "Apache 2.0"
 
@@ -4,12 +4,12 @@
 import logging
 from typing import Any, List, Optional, Generator
 
-from pydantic import Field, BaseModel, PrivateAttr, model_validator
+from pydantic import Field, BaseModel, PrivateAttr, validator, model_validator
 from botocore.config import Config
 
 from rhubarb.models import LanguageModels
 from rhubarb.invocations import Invocations
-from rhubarb.user_prompts import AnthropicMessages
+from rhubarb.user_prompts import UserMessages
 from rhubarb.system_prompts import SystemPrompts
 
 logger = logging.getLogger(__name__)
@@ -53,9 +53,15 @@ class DocAnalysis(BaseModel):
     modelId: LanguageModels = Field(default=LanguageModels.CLAUDE_SONNET_V2)
     """Bedrock Model ID"""
 
-    system_prompt: str = Field(default=SystemPrompts().DefaultSysPrompt)
+    system_prompt: str = Field(default="")
     """System prompt"""
 
+    @validator("system_prompt", pre=True, always=True)
+    def set_system_prompt(cls, v, values):
+        return SystemPrompts(
+            model_id=values.get("modelId", LanguageModels.CLAUDE_SONNET_V2)
+        ).DefaultSysPrompt
+
     boto3_session: Any
     """Instance of boto3.session.Session"""
 
@@ -129,14 +135,14 @@ def validate_model(cls, values: dict) -> dict:
     def history(self) -> Any:
         return self._message_history
 
-    def _get_anthropic_prompt(
+    def _get_user_prompt(
         self,
         message: Any,
         sys_prompt: str,
         output_schema: Optional[dict] = None,
         history: Optional[List[dict]] = None,
     ) -> Any:
-        return AnthropicMessages(
+        return UserMessages(
             file_path=self.file_path,
             s3_client=self._s3_client,
             system_prompt=sys_prompt,
@@ -147,6 +153,7 @@ def _get_anthropic_prompt(
             pages=self.pages,
             use_converse_api=self.use_converse_api,
             message_history=history,
+            modelId=self.modelId,
         )
 
     def run(
@@ -163,12 +170,14 @@ def run(
         - `output_schema` (`Optional[dict]`, optional): The output JSON schema for the language model response. Defaults to None.
         """
         if (
-            self.modelId == LanguageModels.CLAUDE_OPUS_V1
-            or self.modelId == LanguageModels.CLAUDE_HAIKU_V1
+            self.modelId == LanguageModels.CLAUDE_HAIKU_V1
             or self.modelId == LanguageModels.CLAUDE_SONNET_V1
-            or self.modelId == LanguageModels.CLAUDE_SONNET_V2 
+            or self.modelId == LanguageModels.CLAUDE_SONNET_V2
+            or self.modelId == LanguageModels.NOVA_LITE
+            or self.modelId == LanguageModels.NOVA_PRO
         ):
-            a_msg = self._get_anthropic_prompt(
+            # sys_prompt = SystemPrompts(model_id=self.modelId).DefaultSysPrompt
+            a_msg = self._get_user_prompt(
                 message=message,
                 output_schema=output_schema,
                 sys_prompt=self.system_prompt,
@@ -182,8 +191,8 @@ def run(
             boto3_session=self.boto3_session,
             model_id=self.modelId.value,
             output_schema=output_schema,
-            use_converse_api = self.use_converse_api,
-            enable_cri = self.enable_cri
+            use_converse_api=self.use_converse_api,
+            enable_cri=self.enable_cri,
         )
         response = model_invoke.run_inference()
         self._message_history = model_invoke.message_history
@@ -202,20 +211,22 @@ def run_stream(
             self.modelId == LanguageModels.CLAUDE_OPUS_V1
             or self.modelId == LanguageModels.CLAUDE_HAIKU_V1
             or self.modelId == LanguageModels.CLAUDE_SONNET_V1
-            or self.modelId == LanguageModels.CLAUDE_SONNET_V2 
+            or self.modelId == LanguageModels.CLAUDE_SONNET_V2
+            or self.modelId == LanguageModels.NOVA_LITE
+            or self.modelId == LanguageModels.NOVA_PRO
         ):
-            a_msg = self._get_anthropic_prompt(
+            a_msg = self._get_user_prompt(
                 message=message, sys_prompt=self.system_prompt, history=history
             )
             body = a_msg.messages()
 
         model_invoke = Invocations(
-            body=body, 
+            body=body,
             bedrock_client=self._bedrock_client,
             boto3_session=self.boto3_session,
             model_id=self.modelId.value,
-            use_converse_api = self.use_converse_api,
-            enable_cri = self.enable_cri
+            use_converse_api=self.use_converse_api,
+            enable_cri=self.enable_cri,
         )
         for response in model_invoke.run_inference_stream():
             yield response
@@ -233,26 +244,28 @@ def run_entity(self, message: Any, entities: List[Any]) -> Any:
             self.modelId == LanguageModels.CLAUDE_OPUS_V1
             or self.modelId == LanguageModels.CLAUDE_HAIKU_V1
             or self.modelId == LanguageModels.CLAUDE_SONNET_V1
-            or self.modelId == LanguageModels.CLAUDE_SONNET_V2            
+            or self.modelId == LanguageModels.CLAUDE_SONNET_V2
+            or self.modelId == LanguageModels.NOVA_LITE
+            or self.modelId == LanguageModels.NOVA_PRO
         ):
-            sys_prompt = SystemPrompts(entities=entities).NERSysPrompt
-            a_msg = self._get_anthropic_prompt(message=message, sys_prompt=sys_prompt)
+            sys_prompt = SystemPrompts(entities=entities, model_id=self.modelId).NERSysPrompt
+            a_msg = self._get_user_prompt(message=message, sys_prompt=sys_prompt)
             body = a_msg.messages()
 
         model_invoke = Invocations(
-            body=body, 
+            body=body,
             bedrock_client=self._bedrock_client,
             boto3_session=self.boto3_session,
             model_id=self.modelId.value,
-            use_converse_api = self.use_converse_api,
-            enable_cri = self.enable_cri
+            use_converse_api=self.use_converse_api,
+            enable_cri=self.enable_cri,
         )
         response = model_invoke.run_inference()
         return response
 
     def generate_schema(self, message: str, assistive_rephrase: Optional[bool] = False) -> dict:
         """
-        Invokes the specified language model with the given message to genereate a JSON
+        Invokes the specified language model with the given message to generate a JSON
         schema for a given document.
 
         Args:
@@ -264,21 +277,23 @@ def generate_schema(self, message: str, assistive_rephrase: Optional[bool] = Fal
             or self.modelId == LanguageModels.CLAUDE_HAIKU_V1
             or self.modelId == LanguageModels.CLAUDE_SONNET_V1
             or self.modelId == LanguageModels.CLAUDE_SONNET_V2
+            or self.modelId == LanguageModels.NOVA_LITE
+            or self.modelId == LanguageModels.NOVA_PRO
         ):
             if assistive_rephrase:
-                sys_prompt = SystemPrompts().SchemaGenSysPromptWithRephrase
+                sys_prompt = SystemPrompts(model_id=self.modelId).SchemaGenSysPromptWithRephrase
             else:
-                sys_prompt = SystemPrompts().SchemaGenSysPrompt
-            a_msg = self._get_anthropic_prompt(message=message, sys_prompt=sys_prompt)
+                sys_prompt = SystemPrompts(model_id=self.modelId).SchemaGenSysPrompt
+            a_msg = self._get_user_prompt(message=message, sys_prompt=sys_prompt)
             body = a_msg.messages()
 
         model_invoke = Invocations(
-            body=body, 
+            body=body,
             bedrock_client=self._bedrock_client,
             boto3_session=self.boto3_session,
             model_id=self.modelId.value,
-            use_converse_api = self.use_converse_api,
-            enable_cri = self.enable_cri
+            use_converse_api=self.use_converse_api,
+            enable_cri=self.enable_cri,
         )
         response = model_invoke.run_inference()
         return response
@@ -219,9 +219,14 @@ def _invoke_model_json(self) -> dict:
         with response["body"] as stream:
             response_body = json.load(stream)
 
-        response_text = response_body["content"][0]["text"]
-        input_tokens = response_body["usage"]["input_tokens"]
-        output_tokens = response_body["usage"]["output_tokens"]
+        if "nova" in str((self.model_id)).lower():
+            response_text = response_body["output"]["message"]["content"][0]["text"]
+            input_tokens = response_body["usage"]["inputTokens"]
+            output_tokens = response_body["usage"]["outputTokens"]
+        else:
+            response_text = response_body["content"][0]["text"]
+            input_tokens = response_body["usage"]["input_tokens"]
+            output_tokens = response_body["usage"]["output_tokens"]
         total_tokens = input_tokens + output_tokens
 
         self.token_usage = {
@@ -231,7 +236,13 @@ def _invoke_model_json(self) -> dict:
         }
 
         messages = self.body["messages"]
-        messages.append({"role": response_body["role"], "content": response_body["content"]})
+        messages.append(
+            {
+                "role": response_body.get("role", "assistant"),
+                "content": response_body.get("content")
+                or response_body.get("output", {}).get("message", {}).get("content", ""),
+            }
+        )
 
         self.history = messages
         output = self._extract_json_from_markdown(response_text)
 
@@ -9,6 +9,8 @@ class LanguageModels(Enum):
     CLAUDE_SONNET_V1 = "anthropic.claude-3-sonnet-20240229-v1:0"
     CLAUDE_HAIKU_V1 = "anthropic.claude-3-haiku-20240307-v1:0"
     CLAUDE_SONNET_V2 = "anthropic.claude-3-5-sonnet-20240620-v1:0"
+    NOVA_PRO = "amazon.nova-pro-v1:0"
+    NOVA_LITE = "amazon.nova-lite-v1:0"
 
 
 class EmbeddingModels(Enum):