본문 바로가기
Natural Intelligence

[Pharmacy] RDKit

by goatlab 2022. 10. 13.
728x90
반응형
SMALL

RDKit

 

 

RDkit은 오픈 소스 정보 화학 소프트웨어이다.

 

SMILES (Simplified Molecular Input Line Entry System)

 

SMILES 표기법은 Simplified Molecular Input Line Entry System의 준말로, 분자 구조를 string 형태로 표현한다. NLP에서 사용하는 다양한 머신러닝/딥러닝 알고리즘들을 분자 구조에도 적용할 수 있게 해 주는 표기법이기도 하다. SMILES 표기법을 구성하는 분자 구조의 요소는 크게 원자 (atom), 결합 (bond), 고리 (ring), 방향족 (aromaticity), 가지 (branch) 5개로 구성된다.

 

설치

 

conda create -c conda-forge -n my-rdkit-env rdkit
conda activate my-rdkit-env

# 오류시
cd [anaconda folder]/bin
source activate my-rdkit-env
# window
activate my-rdkit-env

 

SMILE 분자 표기 / 표현

 

import rdkit
from rdkit import Chem 
from rdkit.Chem import Draw
from rdkit.Chem import AllChem
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
from rdkit.Chem.Draw import IPythonConsole

IPythonConsole.ipython_useSVG=True

# 물
m = Chem.MolFromSmiles('O')
m

# 메탄올
m = Chem.MolFromSmiles('CO')
m

# 벤젠
m = Chem.MolFromSmiles('c1ccccc1')
m

# # SMILES 표기법은 동일 분자를 다양하게 표현
print(Chem.MolToSmiles(Chem.MolFromSmiles('C1=CC=CN=C1')))
print(Chem.MolToSmiles(Chem.MolFromSmiles('c1cccnc1')))
print(Chem.MolToSmiles(Chem.MolFromSmiles('n1ccccc1')))
c1ccncc1
c1ccncc1
c1ccncc1

 

https://www.rdkit.org/docs/Install.html#how-to-install-rdkit-with-conda

 

Installation — The RDKit 2022.03.1 documentation

Installation Below a number of installation recipes is presented, with varying degree of complexity. Cross-platform under anaconda python (fastest install) Introduction to anaconda Conda is an open-source, cross-platform, software package manager. It suppo

www.rdkit.org

 

728x90
반응형
LIST

'Natural Intelligence' 카테고리의 다른 글

자연 지능 (Natural Intelligence)  (0) 2022.12.08
[Pharmacy] DeepChem  (0) 2022.10.13
[Pharmacy] 약물 (Drug)  (0) 2022.10.13
약학 (Pharmacy)  (0) 2022.10.13
뇌과학 (Brain Science)  (0) 2022.07.13