Genomic Region

`gentropy.common.genomic_region.KnownGenomicRegions` ¶

Bases: Enum

Known genomic regions in the human genome in string format.

Source code in src/gentropy/common/genomic_region.py

class KnownGenomicRegions(Enum):
    """Known genomic regions in the human genome in string format."""

    MHC = "chr6:25726063-33400556"

`gentropy.common.genomic_region.GenomicRegion` ¶

Genomic regions of interest.

Attributes:

Name	Type	Description
`chromosome`	`str`	Chromosome.
`start`	`int`	Start position.
`end`	`int`

Source code in src/gentropy/common/genomic_region.py

class GenomicRegion:
    """Genomic regions of interest.

    Attributes:
        chromosome (str): Chromosome.
        start (int): Start position.
        end (int):
    """

    def __init__(self, chromosome: str, start: int, end: int) -> None:
        """Class constructor.

        Args:
            chromosome (str): Chromosome.
            start (int): Start position.
            end (int): End position.
        """
        self.chromosome = chromosome
        self.start = start
        self.end = end

    def __str__(self) -> str:
        """String representation of the genomic region.

        Returns:
            str: Genomic region in chr:start-end format.
        """
        return f"{self.chromosome}:{self.start}-{self.end}"

    @classmethod
    def from_string(cls: type["GenomicRegion"], region: str) -> "GenomicRegion":
        """Parse region string to chr:start-end.

        Args:
            region (str): Genomic region expected to follow chr##:#,###-#,### format or ##:####-#####.

        Returns:
            GenomicRegion: Genomic region object.

        Raises:
            ValueError: If the end and start positions cannot be casted to integer or not all three values value error is raised.

        Examples:
            >>> print(GenomicRegion.from_string('chr6:28,510,120-33,480,577'))
            6:28510120-33480577
            >>> print(GenomicRegion.from_string('6:28510120-33480577'))
            6:28510120-33480577
            >>> print(GenomicRegion.from_string('6:28510120'))
            Traceback (most recent call last):
                ...
            ValueError: Genomic region should follow a ##:####-#### format.
            >>> print(GenomicRegion.from_string('6:28510120-foo'))
            Traceback (most recent call last):
                ...
            ValueError: Start and the end position of the region has to be integer.
        """
        region = region.replace(":", "-").replace(",", "")
        try:
            chromosome, start_position, end_position = region.split("-")
        except ValueError as err:
            raise ValueError(
                "Genomic region should follow a ##:####-#### format."
            ) from err

        try:
            return cls(
                chromosome=chromosome.replace("chr", ""),
                start=int(start_position),
                end=int(end_position),
            )
        except ValueError as err:
            raise ValueError(
                "Start and the end position of the region has to be integer."
            ) from err

    @classmethod
    def from_known_genomic_region(
        cls: type["GenomicRegion"], region: KnownGenomicRegions
    ) -> "GenomicRegion":
        """Get known genomic region.

        Args:
            region (KnownGenomicRegions): Known genomic region.

        Returns:
            GenomicRegion: Genomic region object.

        Examples:
            >>> print(GenomicRegion.from_known_genomic_region(KnownGenomicRegions.MHC))
            6:25726063-33400556
        """
        return GenomicRegion.from_string(region.value)

`init(chromosome: str, start: int, end: int) -> None` ¶

Class constructor.

Parameters:

Name	Type	Description	Default
`chromosome`	`str`	Chromosome.	required
`start`	`int`	Start position.	required
`end`	`int`	End position.	required

Source code in src/gentropy/common/genomic_region.py

def __init__(self, chromosome: str, start: int, end: int) -> None:
    """Class constructor.

    Args:
        chromosome (str): Chromosome.
        start (int): Start position.
        end (int): End position.
    """
    self.chromosome = chromosome
    self.start = start
    self.end = end

`from_known_genomic_region(region: KnownGenomicRegions) -> GenomicRegion` `classmethod` ¶

Get known genomic region.

Parameters:

Name	Type	Description	Default
`region`	`KnownGenomicRegions`	Known genomic region.	required

Returns:

Name	Type	Description
`GenomicRegion`	`GenomicRegion`	Genomic region object.

Examples:

>>> print(GenomicRegion.from_known_genomic_region(KnownGenomicRegions.MHC))
6:25726063-33400556

Source code in src/gentropy/common/genomic_region.py

@classmethod
def from_known_genomic_region(
    cls: type["GenomicRegion"], region: KnownGenomicRegions
) -> "GenomicRegion":
    """Get known genomic region.

    Args:
        region (KnownGenomicRegions): Known genomic region.

    Returns:
        GenomicRegion: Genomic region object.

    Examples:
        >>> print(GenomicRegion.from_known_genomic_region(KnownGenomicRegions.MHC))
        6:25726063-33400556
    """
    return GenomicRegion.from_string(region.value)

`from_string(region: str) -> GenomicRegion` `classmethod` ¶

Parse region string to chr:start-end.

Parameters:

Name	Type	Description	Default
`region`	`str`	Genomic region expected to follow chr##:#,###-#,### format or ##:####-#####.	required

Returns:

Name	Type	Description
`GenomicRegion`	`GenomicRegion`	Genomic region object.

Raises:

Type	Description
`ValueError`	If the end and start positions cannot be casted to integer or not all three values value error is raised.

Examples:

>>> print(GenomicRegion.from_string('chr6:28,510,120-33,480,577'))
6:28510120-33480577
>>> print(GenomicRegion.from_string('6:28510120-33480577'))
6:28510120-33480577
>>> print(GenomicRegion.from_string('6:28510120'))
Traceback (most recent call last):
    ...
ValueError: Genomic region should follow a ##:####-#### format.
>>> print(GenomicRegion.from_string('6:28510120-foo'))
Traceback (most recent call last):
    ...
ValueError: Start and the end position of the region has to be integer.

Source code in src/gentropy/common/genomic_region.py

@classmethod
def from_string(cls: type["GenomicRegion"], region: str) -> "GenomicRegion":
    """Parse region string to chr:start-end.

    Args:
        region (str): Genomic region expected to follow chr##:#,###-#,### format or ##:####-#####.

    Returns:
        GenomicRegion: Genomic region object.

    Raises:
        ValueError: If the end and start positions cannot be casted to integer or not all three values value error is raised.

    Examples:
        >>> print(GenomicRegion.from_string('chr6:28,510,120-33,480,577'))
        6:28510120-33480577
        >>> print(GenomicRegion.from_string('6:28510120-33480577'))
        6:28510120-33480577
        >>> print(GenomicRegion.from_string('6:28510120'))
        Traceback (most recent call last):
            ...
        ValueError: Genomic region should follow a ##:####-#### format.
        >>> print(GenomicRegion.from_string('6:28510120-foo'))
        Traceback (most recent call last):
            ...
        ValueError: Start and the end position of the region has to be integer.
    """
    region = region.replace(":", "-").replace(",", "")
    try:
        chromosome, start_position, end_position = region.split("-")
    except ValueError as err:
        raise ValueError(
            "Genomic region should follow a ##:####-#### format."
        ) from err

    try:
        return cls(
            chromosome=chromosome.replace("chr", ""),
            start=int(start_position),
            end=int(end_position),
        )
    except ValueError as err:
        raise ValueError(
            "Start and the end position of the region has to be integer."
        ) from err

2024-09-18
2024-09-18
Contributors

Genomic Region

gentropy.common.genomic_region.KnownGenomicRegions ¶

gentropy.common.genomic_region.GenomicRegion ¶

__init__(chromosome: str, start: int, end: int) -> None ¶

from_known_genomic_region(region: KnownGenomicRegions) -> GenomicRegion classmethod ¶

from_string(region: str) -> GenomicRegion classmethod ¶

`gentropy.common.genomic_region.KnownGenomicRegions` ¶

`gentropy.common.genomic_region.GenomicRegion` ¶

`init(chromosome: str, start: int, end: int) -> None` ¶

`from_known_genomic_region(region: KnownGenomicRegions) -> GenomicRegion` `classmethod` ¶

`from_string(region: str) -> GenomicRegion` `classmethod` ¶