from molpher.core import MolpherMol

cymene_smiles = MolpherMol("CC1=CC=C(C(C)C)C=C1")
print(cymene_smiles.smiles)
cymene_sdf = MolpherMol("cymene.sdf") # if the string ends with '.sdf', the library interprets it as a path to a file
print(cymene_sdf.smiles)

CC1=CC=C(C(C)C)C=C1
CC1=CC=C(C(C)C)C=C1


# imports that will enable direct display of RDKit molecules
from rdkit.Chem.Draw import IPythonConsole
from rdkit.Chem.Draw.MolDrawing import MolDrawing, DrawingOptions
IPythonConsole.ipython_useSVG = False
DrawingOptions.includeAtomNumbers = True

cymene_rdkit = cymene_sdf.asRDMol()
print(cymene_rdkit.__class__)
cymene_rdkit

<class 'rdkit.Chem.rdchem.Mol'>


MolpherMol(other=cymene_rdkit).smiles

'CC1=CC=C(C(C)C)C=C1'


MolpherMol(other=cymene_smiles).smiles

'CC1=CC=C(C(C)C)C=C1'


with open("cymene.sdf", "r") as cymene_file:
    print(cymene_file.read())

7463
  -OEChem-06091704012D

 24 24  0     0  0  0  0  0  0999 V2000
    2.8660    1.7500    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    2.8660    0.7500    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    3.7320    2.2500    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    2.0000    2.2500    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    2.0000    0.2500    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    3.7320    0.2500    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    2.8660   -1.2500    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    2.0000   -0.7500    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    3.7320   -0.7500    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    2.8660   -2.2500    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    2.8660    2.3700    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    4.0420    1.7131    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    4.2690    2.5600    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    3.4220    2.7869    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    2.3100    2.7869    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.4631    2.5600    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.6900    1.7131    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.4631    0.5600    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    4.2690    0.5600    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.4631   -1.0600    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    4.2690   -1.0600    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    2.2460   -2.2500    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    2.8660   -2.8700    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    3.4860   -2.2500    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
  1  2  1  0  0  0  0
  1  3  1  0  0  0  0
  1  4  1  0  0  0  0
  1 11  1  0  0  0  0
  2  5  2  0  0  0  0
  2  6  1  0  0  0  0
  3 12  1  0  0  0  0
  3 13  1  0  0  0  0
  3 14  1  0  0  0  0
  4 15  1  0  0  0  0
  4 16  1  0  0  0  0
  4 17  1  0  0  0  0
  5  8  1  0  0  0  0
  5 18  1  0  0  0  0
  6  9  2  0  0  0  0
  6 19  1  0  0  0  0
  7  8  2  0  0  0  0
  7  9  1  0  0  0  0
  7 10  1  0  0  0  0
  8 20  1  0  0  0  0
  9 21  1  0  0  0  0
 10 22  1  0  0  0  0
 10 23  1  0  0  0  0
 10 24  1  0  0  0  0
M  END
> <MOLPHER_NO_ADDITION>
2,5,6,7,8,9

> <MOLPHER_NO_REMOVAL>
2,5,6,7,8,9,10

$$$$


def get_locked_atoms(mol):
    return [(idx, atm) for idx, atm in enumerate(mol.atoms) if atm.is_locked]

locked_atoms = get_locked_atoms(cymene_sdf)
locked_atoms

[(1, <molpher.core.MolpherAtom.MolpherAtom at 0x7f2daaee66f0>),
 (4, <molpher.core.MolpherAtom.MolpherAtom at 0x7f2daaee67e0>),
 (5, <molpher.core.MolpherAtom.MolpherAtom at 0x7f2daaee6810>),
 (6, <molpher.core.MolpherAtom.MolpherAtom at 0x7f2daaee6840>),
 (7, <molpher.core.MolpherAtom.MolpherAtom at 0x7f2daaee6870>),
 (8, <molpher.core.MolpherAtom.MolpherAtom at 0x7f2daaee68a0>),
 (9, <molpher.core.MolpherAtom.MolpherAtom at 0x7f2daaee68d0>)]


cymene_rdkit.GetPropsAsDict()

{'MOLPHER_NO_ADDITION': '2,5,6,7,8,9', 'MOLPHER_NO_REMOVAL': '2,5,6,7,8,9,10'}


from rdkit.Chem.Draw import rdMolDraw2D
from IPython.display import SVG

def show_locked_atoms(mol):
    drawer = rdMolDraw2D.MolDraw2DSVG(200, 200)
    drawer.DrawMolecule(
        mol.asRDMol()
        , highlightAtoms=[x[0] for x in get_locked_atoms(mol)]
    )
    drawer.FinishDrawing()
    return drawer.GetDrawingText().replace('svg:','')

SVG(show_locked_atoms(cymene_sdf))


for atm in locked_atoms:
    print(atm[1].lock_info)

{'UNLOCKED': False, 'NO_MUTATION': False, 'NO_ADDITION': True, 'NO_REMOVAL': True, 'KEEP_NEIGHBORS': False, 'KEEP_NEIGHBORS_AND_BONDS': False, 'KEEP_BONDS': False, 'FULL_LOCK': False}
{'UNLOCKED': False, 'NO_MUTATION': False, 'NO_ADDITION': True, 'NO_REMOVAL': True, 'KEEP_NEIGHBORS': False, 'KEEP_NEIGHBORS_AND_BONDS': False, 'KEEP_BONDS': False, 'FULL_LOCK': False}
{'UNLOCKED': False, 'NO_MUTATION': False, 'NO_ADDITION': True, 'NO_REMOVAL': True, 'KEEP_NEIGHBORS': False, 'KEEP_NEIGHBORS_AND_BONDS': False, 'KEEP_BONDS': False, 'FULL_LOCK': False}
{'UNLOCKED': False, 'NO_MUTATION': False, 'NO_ADDITION': True, 'NO_REMOVAL': True, 'KEEP_NEIGHBORS': False, 'KEEP_NEIGHBORS_AND_BONDS': False, 'KEEP_BONDS': False, 'FULL_LOCK': False}
{'UNLOCKED': False, 'NO_MUTATION': False, 'NO_ADDITION': True, 'NO_REMOVAL': True, 'KEEP_NEIGHBORS': False, 'KEEP_NEIGHBORS_AND_BONDS': False, 'KEEP_BONDS': False, 'FULL_LOCK': False}
{'UNLOCKED': False, 'NO_MUTATION': False, 'NO_ADDITION': True, 'NO_REMOVAL': True, 'KEEP_NEIGHBORS': False, 'KEEP_NEIGHBORS_AND_BONDS': False, 'KEEP_BONDS': False, 'FULL_LOCK': False}
{'UNLOCKED': False, 'NO_MUTATION': False, 'NO_ADDITION': False, 'NO_REMOVAL': True, 'KEEP_NEIGHBORS': False, 'KEEP_NEIGHBORS_AND_BONDS': False, 'KEEP_BONDS': False, 'FULL_LOCK': False}


from molpher.core import MolpherAtom

locked_atoms[0][1].locking_mask = locked_atoms[0][1].locking_mask | MolpherAtom.KEEP_NEIGHBORS_AND_BONDS


MolpherAtom.lockingMaskToString(locked_atoms[0][1].locking_mask)

('NO_ADDITION',
 'NO_REMOVAL',
 'KEEP_NEIGHBORS',
 'KEEP_NEIGHBORS_AND_BONDS',
 'KEEP_BONDS')


print(cymene_sdf.getAtom(1).lock_info)

{'UNLOCKED': False, 'NO_MUTATION': False, 'NO_ADDITION': True, 'NO_REMOVAL': True, 'KEEP_NEIGHBORS': True, 'KEEP_NEIGHBORS_AND_BONDS': True, 'KEEP_BONDS': True, 'FULL_LOCK': False}


def show_locked_atoms(mol, mask = MolpherAtom.FULL_LOCK):
    drawer = rdMolDraw2D.MolDraw2DSVG(300, 300)
    drawer.DrawMolecule(
        mol.asRDMol()
        , highlightAtoms=[x[0] for x in get_locked_atoms(mol) if (x[1].locking_mask & mask) != 0]
    )
    drawer.FinishDrawing()
    return drawer.GetDrawingText().replace('svg:','')


SVG(show_locked_atoms(cymene_sdf))


SVG(show_locked_atoms(cymene_sdf, MolpherAtom.NO_ADDITION))


SVG(show_locked_atoms(cymene_sdf, MolpherAtom.KEEP_NEIGHBORS_AND_BONDS))


from molpher.core.morphing.operators import AddAtom

add_atom = AddAtom()
add_atom.setOriginal(cymene_sdf)
morph = add_atom.morph()
print(morph.smiles)

CCC(C)C1=CC=C(C)C=C1


morph.asRDMol()


morphs = [add_atom.morph() for i in range(10)]
[x.smiles for x in morphs]

['CC1=CC=C(C(C)(C)C)C=C1',
 'CC1=CC=C(C(C)CS)C=C1',
 'CC1=CC=C(C(C)(C)C)C=C1',
 'CC1=CC=C(C(C)CS)C=C1',
 'CC1=CC=C(C(C)CN)C=C1',
 'CC1=CC=C(C(C)CBr)C=C1',
 'CC1=CC=C(C(C)(C)Br)C=C1',
 'CC1=CC=C(C(C)(C)S)C=C1',
 'CC1=CC=C(C(C)CI)C=C1',
 'CC(C)C1=CC=C(CBr)C=C1']


from rdkit.Chem.Draw import MolsToGridImage

def show_mol_grid(mols):
    return MolsToGridImage(
        [x.asRDMol() for x in morphs]
        ,subImgSize=(250,200)
    )

show_mol_grid(morphs)


add_atom.setOriginal(cymene_sdf)
morphs = []
for iter in range(10):
    morph = add_atom.morph()
    if morph:
        morphs.append(morph)
        add_atom.setOriginal(morph)

show_mol_grid(morphs)


from molpher.core.morphing import AtomLibrary

my_lib = AtomLibrary(["C"])
add_atom = AddAtom(my_lib)

add_atom.setOriginal(cymene_sdf)
morphs = []
for iter in range(10):
    morph = add_atom.morph()
    if morph:
        morphs.append(morph)
        add_atom.setOriginal(morph)

show_mol_grid(morphs)


def show_mol_grid(mols):
    locked_atoms = [[y[0] for y in get_locked_atoms(x)] for x in morphs]
    return MolsToGridImage(
        [x.asRDMol() for x in morphs]
        , subImgSize=(250,200)
        , highlightAtomLists=locked_atoms
    )

show_mol_grid(morphs)


from molpher.core.morphing.operators import *
from molpher.core.morphing import Molpher

operators = [
    AddAtom()
    , AddBond()
    , ContractBond()
    , InterlayAtom()
    , MutateAtom()
    , RemoveBond()
    , RerouteBond()
    , RemoveAtom()
]
molpher = Molpher(cymene_sdf, operators, attempts=20)
molpher()
morphs = molpher.getMorphs()
show_mol_grid(morphs)


morphs = []
for idx, morph in enumerate(molpher):
    if idx == 12: # this loop is infinite so we stop after 50 morphs
        break
    morphs.append(morph)

show_mol_grid(morphs)


from rdkit import Chem
from molpher.core.morphing.operators import MorphingOperator
import random

class IntroduceNitrogen(MorphingOperator):

    def setOriginal(self, mol):
        super(IntroduceNitrogen, self).setOriginal(mol)
        
        # generate candidates for the replacement
        candidates = Chem.ReplaceSubstructs(
            self.original.asRDMol(include_locks=False), 
            Chem.MolFromSmiles('C'), 
            Chem.MolFromSmiles('N'),
            replaceAll=False
        )
        
        # filter potential nonsence molecules
        viable = []
        for x in candidates:
            try:
                Chem.rdmolops.SanitizeMol(x)
                viable.append(x)
            except ValueError:
                continue
        
        self.candidates = viable

    def morph(self):
        return MolpherMol(other=self.candidates[random.randint(0, len(self.candidates)-1)])


operators = [
    AddAtom()
    , RemoveAtom()
    , IntroduceNitrogen()
]
molpher = Molpher(cymene_sdf, operators, attempts=20)
molpher()
morphs = molpher.getMorphs()
show_mol_grid(morphs)

RDKit ERROR: [18:38:13] Can't kekulize mol.  Unkekulized atoms: 3 4 5 6 7
RDKit ERROR: 
RDKit ERROR: [18:38:13] Can't kekulize mol.  Unkekulized atoms: 1 4 5 6 7
RDKit ERROR:

Molpher-lib¶

Atom locking¶

Custom Morphing Operators¶

Summary¶