USEPA · shapiromatron · Mar 6, 2025 · Jan 5, 2025 · Jan 5, 2025 · Jan 6, 2025
diff --git a/src/pybmds/__init__.py b/src/pybmds/__init__.py
@@ -1,4 +1,4 @@
-__version__ = "24.1"  # see docs/development for versioning
+__version__ = "25.1a1"  # see docs/development for versioning
 
 from .batch import BatchResponse, BatchSession  # noqa: F401
 from .constants import DistType as ContinuousDistType  # noqa: F401

diff --git a/src/pybmds/datasets/transforms/rao_scott.py b/src/pybmds/datasets/transforms/rao_scott.py
@@ -0,0 +1,207 @@
+"""
+Rao Scott Adjustment, original citation:
+
+Fox JF, Hogan KA, Davis A. Dose-Response Modeling with Summary Data from Developmental Toxicity
+Studies. Risk Anal. 2017 May;37(5):905-917. doi: 10.1111/risa.12667. PMID: 27567129.
+"""
+
+from enum import StrEnum
+from io import BytesIO
+from typing import ClassVar, NamedTuple
+
+import numpy as np
+import pandas as pd
+from matplotlib.figure import Figure
+
+from ... import plotting
+from ...reporting.styling import Report, add_mpl_figure, df_to_table, write_setting_p
+from ..dichotomous import DichotomousDataset
+
+
+class Species(StrEnum):
+    rat = "rat"
+    mouse = "mouse"
+    rabbit = "rabbit"
+
+
+class Regression(StrEnum):
+    least_square = "Least Squares"
+    orthogonal = "Orthogonal"
+
+
+class P(NamedTuple):
+    a: float
+    b: float
+    sigma: float
+
+
+class RaoScott:
+    # see Table 2 from paper
+    # fmt: off
+    adjustment_parameters: ClassVar = {
+        (Species.mouse,  Regression.least_square): P(1.5938, 0.2866, 0.2078),
+        (Species.mouse,  Regression.orthogonal):   P(1.6943, 0.3132, 0.1863),
+        (Species.rat,    Regression.least_square): P(1.6852, 0.3310, 0.1248),
+        (Species.rat,    Regression.orthogonal):   P(1.8327, 0.3690, 0.1090),
+        (Species.rabbit, Regression.least_square): P(1.0582, 0.2397, 0.1452),
+        (Species.rabbit, Regression.orthogonal):   P(1.1477, 0.2739, 0.1299),
+    }
+    # fmt: on
+
+    def __init__(self, dataset: DichotomousDataset, species: Species):
+        self.dataset = dataset
+        self.species = species
+        self.df = self.calculate()
+
+    def calculate(self) -> pd.DataFrame:
+        df = pd.DataFrame(
+            {
+                "dose": self.dataset.doses,
+                "incidence": self.dataset.incidences,
+                "n": self.dataset.ns,
+            }
+        )
+        df["fraction_affected"] = df.incidence / df.n
+
+        p = self.adjustment_parameters[(self.species, Regression.least_square)]
+        df["design_ls"] = np.exp(p.a + (p.b * np.log(df.fraction_affected)) + (0.5 * p.sigma))
+
+        p = self.adjustment_parameters[(self.species, Regression.orthogonal)]
+        df["design_o"] = np.exp(p.a + (p.b * np.log(df.fraction_affected)) + (0.5 * p.sigma))
+
+        df["design_avg"] = df[["design_ls", "design_o"]].mean(axis=1)
+        df["incidence_adjusted"] = df.incidence / df.design_avg
+        df["n_adjusted"] = df.n / df.design_avg
+        return df
+
+    def figure(self, figsize: tuple[float, float] | None = None) -> Figure:
+        fig = plotting.create_empty_figure(rows=1, cols=2, figsize=figsize)
+        ax1, ax2 = fig.axes
+
+        # N
+        ax1.set_title("Original N vs Adjusted N")
+        ax1.set_xlabel("Dose")
+        ax1.set_ylabel("N")
+        ax1.margins(plotting.PLOT_MARGINS)
+        ax1.plot(
+            self.df.dose,
+            self.df.n,
+            "o-",
+            color="FireBrick",
+            label="Original N",
+            markersize=8,
+            markeredgewidth=1,
+            markeredgecolor="white",
+        )
+        ax1.plot(
+            self.df.dose,
+            self.df.n_adjusted,
+            "^-",
+            color="LightSalmon",
+            label="Adjusted N",
+            markersize=8,
+            markeredgewidth=1,
+            markeredgecolor="white",
+        )
+        legend = ax1.legend(**plotting.LEGEND_OPTS)
+        for handle in legend.legend_handles:
+            handle.set_markersize(8)
+
+        # Incidence
+        ax2.set_title("Original Incidence vs Adjusted Incidence")
+        ax2.set_xlabel("Dose")
+        ax2.set_ylabel("Incidence")
+        ax2.margins(plotting.PLOT_MARGINS)
+        ax2.plot(
+            self.df.dose,
+            self.df.incidence,
+            "o-",
+            color="MidnightBlue",
+            label="Original Incidence",
+            markersize=8,
+            markeredgewidth=1,
+            markeredgecolor="white",
+        )
+        ax2.plot(
+            self.df.dose,
+            self.df.incidence_adjusted,
+            "^-",
+            color="LightSkyBlue",
+            label="Adjusted Incidence",
+            markersize=8,
+            markeredgewidth=1,
+            markeredgecolor="white",
+        )
+        legend = ax2.legend(**plotting.LEGEND_OPTS)
+        for handle in legend.legend_handles:
+            handle.set_markersize(8)
+
+        fig.tight_layout()
+        return fig
+
+    def parameter_df(self) -> pd.DataFrame:
+        return pd.DataFrame(
+            data=[(*k, *v) for k, v in self.adjustment_parameters.items()],
+            columns="Species|Regression Method|A|b|sigma".split("|"),
+        )
+
+    def to_docx(
+        self,
+        report: Report | None = None,
+        header_level: int = 1,
+        show_title: bool = True,
+    ):
+        """Returns a word document report.
+
+        Args:
+            report (Report | None, optional): A optional report instance, otherwise create one.
+            header_level (int, optional): The top-level header level, defaults to 1.
+            show_title (bool, optional): Show the top level title, defaults True.
+        """
+        if report is None:
+            report = Report.build_default()
+
+        h1 = report.styles.get_header_style(header_level)
+        h2 = report.styles.get_header_style(header_level)
+
+        if show_title:
+            report.document.add_paragraph("Rao Scott Adjustment", h1)
+
+        report.document.add_paragraph("Summary", h2)
+        write_setting_p(report, "Species: ", self.species.name.title())
+        report.document.add_paragraph(df_to_table(report, self.summary_df()))
+        report.document.add_paragraph(
+            add_mpl_figure(report.document, self.figure(figsize=(8, 4)), 6.5)
+        )
+        report.document.add_paragraph("Rao Scott Adjustment Parameters", h2)
+        report.document.add_paragraph(df_to_table(report, self.parameter_df()))
+        report.document.add_paragraph(
+            "Fox JF, Hogan KA, Davis A. Dose-Response Modeling with Summary Data from Developmental Toxicity Studies. Risk Anal. 2017 May;37(5):905-917. PMID: 27567129. DOI: 10.1111/risa.12667."
+        )
+        return report.document
+
+    def summary_df(self) -> pd.DataFrame:
+        mapping = {
+            "dose": "Dose",
+            "n": "N",
+            "incidence": "Incidence",
+            "fraction_affected": "Fraction Affected",
+            "design_ls": "Design Effect (LS)",
+            "design_o": "Design Effect (OR)",
+            "design_avg": "Design Effect (Average)",
+            "n_adjusted": "N (Rao Scott Adjusted)",
+            "incidence_adjusted": "Incidence (Rao Scott Adjusted)",
+        }
+        return self.df[list(mapping.keys())].rename(columns=mapping)
+
+    def to_excel(self) -> BytesIO:
+        """Returns an Excel report with worksheets summarizing the adjustment.
+
+        Returns:
+            BytesIO: An Excel worksheets.
+        """
+        f = BytesIO()
+        with pd.ExcelWriter(f) as writer:
+            for name, df in [("data", self.summary_df()), ("parameters", self.parameter_df())]:
+                df.to_excel(writer, sheet_name=name, index=False)
+        return f
diff --git a/src/pybmds/plotting.py b/src/pybmds/plotting.py
@@ -39,10 +39,10 @@
 )
 
 
-def create_empty_figure(figsize: tuple[float, float] | None = None):
+def create_empty_figure(rows: int = 1, cols: int = 1, figsize: tuple[float, float] | None = None):
     plt.style.use("seaborn-v0_8-darkgrid")
     mpl.rcParams.update({"font.size": 10})
-    fig, ax = plt.subplots(figsize=figsize or PLOT_FIGSIZE, dpi=DPI)
+    fig, _ = plt.subplots(rows, cols, figsize=figsize or PLOT_FIGSIZE, dpi=DPI)
     return fig
 
 

diff --git a/tests/test_pybmds/datasets/transforms/test_rao_scott.py b/tests/test_pybmds/datasets/transforms/test_rao_scott.py
@@ -0,0 +1,45 @@
+import numpy as np
+import pytest
+
+from pybmds.datasets import DichotomousDataset
+from pybmds.datasets.transforms.rao_scott import RaoScott, Species
+
+
+@pytest.fixture
+def dataset() -> DichotomousDataset:
+    return DichotomousDataset(
+        doses=[0, 7, 35, 100, 175, 350, 500],
+        ns=[470, 211, 232, 220, 241, 237, 166],
+        incidences=[11, 6, 2, 7, 14, 39, 57],
+    )
+
+
+class TestRaoScott:
+    def test_calculations(self, dataset):
+        analysis = RaoScott(dataset=dataset, species=Species.rat)
+
+        assert np.allclose(
+            analysis.df.n_adjusted,
+            [284.16, 119.16, 198.92, 119.45, 105.98, 72.36, 39.15],
+            atol=0.01,
+        )
+        assert np.allclose(
+            analysis.df.incidence_adjusted,
+            [6.65, 3.39, 1.71, 3.8, 6.16, 11.91, 13.44],
+            atol=0.01,
+        )
+
+        assert np.allclose(
+            analysis.df.incidence / analysis.df.n,
+            analysis.df.incidence_adjusted / analysis.df.n_adjusted,
+        )
+
+    def test_reporting(self, dataset, data_path, rewrite_data_files):
+        analysis = RaoScott(dataset=dataset, species=Species.rat)
+
+        xlsx = analysis.to_excel()
+        docx = analysis.to_docx()
+
+        if rewrite_data_files:
+            (data_path / "reports/data-transform-rao-scott.xlsx").write_bytes(xlsx.getvalue())
+            docx.save(data_path / "reports/data-transform-rao-scott.docx")