What is bioinformatics?
Tin sinh học là gì?
Bio: Sinh học phân tử (Molecular Biology)
Informatics: Khoa học tính toán
Bioinformatics: Giải quyết các bài toán
sinh học bằng việc sử dụng các phương
pháp của khoa học tính toán.
Synonyms: Computational biology,
Computational molecular biology,
Biocomputing
34
Thay đổi trong sinh học
Paradigm shift in biology
Một kiểu thức mới đang xuất hiện là tất cả các ‘genes’ sẽ sớm được
biết hết (theo nghĩa có trong các cơ sở dữ liệu điện tử), và nghĩa là
điểm bắt đầu của một khảo sát sinh học sẽ là lý thuyết. Mỗi nhà khoa
học sẽ khởi đầu bằng một ước đoán lý thuyết, rồi mới chuyển qua
làm thí nghiệm để theo hoặc kiểm tra giả thuyết.
Để dùng dòng chảy tri thức trên các mạng toàn cầu, các nhà sinh học
không những phải biết dùng máy tính, mà còn phải thay đổi cách
tiếp cận của mình đối với bài toán hiểu sự sống.
The new paradigm, now emerging, is that all the ‘genes’ will be known (in the sense of being resident in databases available electronically),
and that the starting point of a biological investigation will be theoretical. An individual scientist will begin with a theoretical conjecture,
only then turning to experiment to follow or test that hypothesis.
To use [the] flood of knowledge, which will pour across the computer networks of the world, biologists not only must become compute
32 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 530 | Lượt tải: 3
Bạn đang xem trước 20 trang tài liệu Giáo trình Giới thiệu về tin sinh học, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
i t ế b à o
p h â n c h i a .
2 0
C h r o m o s o m e s , g e n o m e s a n d s e q u e n c i n g
N h i ễ m s ắ c t h ể , h ệ g e n e , v à s ắ p d ã y
X á c đ ị n h d ã y b ố n c h ữ c á i c ủ a m ộ t p h â n t ử D N A c h o
t r ư ớ c g ọ i l à s ắ p d ã y D N A ( D N A s e q u e n c i n g ) .
B ộ g e n e c ủ a m ộ t v i k h u ẩ n ( a b a c t e r i u m ) đ ư ợ c s ắ p
d ã y t o à n b ộ n ă m 1 9 9 5 . B ộ g e n e c ủ a ( y e a s t ) g đ ư ợ c
s ắ p d ã y n ă m 1 9 9 7 , g i u n ( w o r m ) n ă m 1 9 9 9 , r u ồ i ( f l y )
n ă m 2 0 0 0 , v à c ỏ d ạ i ( w e e d ) n ă m 2 0 0 1 .
V i ệ c s ắ p d ã y t o à n b ộ h ệ g e n e c o n n g ư ờ i đ ư ợ c h o à n
t h à n h n ă m 2 0 0 3 , đ ư ợ c b i ế t n h ư h ệ g e n e n g ư ờ i
( h u m a n g e n o m e ) .
C á c h ệ g e n e đ ề u c h ứ a g e n e , v à p h ầ n l ớ n c h ú n g m ã
h ó a p r o t e i n s .
2 1
G e n e s v à s ự t ổ n g h ợ p p r o t e i n
G e n e s l à c á c đ o ạ n đ ặ c b i ệ t c ủ a D N A c ó c h ứ c n ă n g
đ i ề u k h i ể n c ấ u t r ú c v à h o ạ t đ ộ n g c ủ a t ế b à o ; l à đ ơ n
v ị c h ứ c n ă n g c ủ a s ự d i t r u y ề n .
Đ ể h i ể u r õ h ơ n v ề g e n e , t a c ầ n m ô t ả c ơ c h ế t ạ o r a
p r o t e i n s d ự a t r ê n t h ô n g t i n đ ư ợ c m ã h ó a t r o n g
g e n e s . Q u á t r ì n h n à y đ ư ợ c g ọ i l à s ự t ổ n g h ợ p
p r o t e i n s , v à g ồ m b a g i a i đ o ạ n c h í n h :
1 . T r a n s c r i p t i o n ( p h i ê n m ã )
2 . S p l i c i n g ( g h é p m ã )
3 . T r a n s l a t i o n ( d ị c h m ã ) .
2 2
T ổ n g h ợ p p r o t e i n
B ỏ đ i v à i m ẩ u c ủ a p r e m R N A , g ọ i l à i n t r o n s , p h ầ n c ò n
l ạ i , g ọ i l à e x o n s , s ẽ đ ư ợ c n ố i v ớ i n h a u . S ố l ư ợ n g v à
k í c h t h ư ớ c c á c i n t r o n s v à e x o n s k h á c n h a u r ấ t đ á n g k ể
c á c g e n e s c ũ n g n h ư g i ữ a c á c c h ủ n g l o ạ i .
T ạ o p r o t e i n s b ằ n g c á c h n ố i
c á c a m i n o a c i d s t h e o t h ứ t ự
đ ự ợ c m ã h ó a t r o n g m R N A .
T h ứ t ự c ủ a a m i n o a c i d s đ ư ợ c
x á c đ ị n h b ở i 3 đ ơ n p h â n t ử
k ề n h a u t r o n g D N A , g ọ i l à b ộ
b a h o ặ c m ã d i t r u y ề n
( t r i p l e t o r g e n e t i c c o d e ) .
M ỗ i b ộ b a đ ư ợ c g ọ i l à c o d o n
v à m ã c h o m ộ t a m i n o a c i d .
M ộ t đ o ạ n p h â n t ử D N A đ ư ợ c
s a o c h é p v à o m R N A b ổ s u n g
( p h i ê n m ã )
S ự d ị c h m ã l à
m ộ t q u á
t r ì n h p h ứ c
t ạ p v à n h i ề u
c h i t i ế t c h ư a
đ ư ợ c b i ế t .
2 3
B à i t o á n đ o á n n h ậ n g e n e
G e n e p r e d i c t i o n p r o b l e m
G e n e p r e d i c t i o n : C h o m ộ t d ã y D N A , h ã y n ó i
g e n e ở đ â u t r o n g d ã y n à y ?
< 5 %3 0 , 0 0 0H u m a n
2 0 %2 5 , 5 0 0W e e d
2 0 %1 4 , 0 0 0F l y ( r u ồ i )
2 7 %1 8 , 0 0 0W o r m ( g i u n )
7 0 %6 0 0 0Y e a s t ( m e n )
9 0 %5 0 0 0E . C o l i ( b a c t e r i a )
P h ầ n c ủ a h ệ g e n e m ã h ó a
p r o t e i n s ( e x o n s )
S ố g e n e s đ ã đ ư ợ c
đ o á n n h ậ n
S i n h v ậ t
2 4
S ự t ư ơ n g t ự c ủ a h ệ g e n e v à S N F s
G e n o m e s i m i l a r i t y a n d S N P s
M ọ i h ệ g e n e c ủ a n g ư ờ i đ ư ợ c x e m l à t ư ơ n g đ ư ơ n g đ ế n
9 9 . 9 % v à t r u n g b ì n h g i ữ a c á c h ệ g e n e s c ủ a h a i c á t h ể k h á c
n h a u c ứ m ộ t n g h ì n đ ơ n p h â n t ử c h ỉ c ó m ộ t k h á c n h a u .
S ự b i ế n d ạ n g t r o n g c á c p h ầ n k h ô n g m ã h ó a c ủ a h ệ g e n e
đ ư ợ c p h â n t í c h đ ể đ ể t ạ o r a c á c d ạ n g ( p a t t e r n s ) t i n c ậ y đ ể
p h â n b i ệ t c á c c a t h ể .
C á c b i ế n d ạ n g đ ặ c b i ệ t q u a n t r ọ n g t r o n g h ệ g e n e l à đ a đ ẳ n g
đ ơ n p h â n t ử ( s i n g l e n u c l e o t i d e p o l y m o r p h i s m s ( S N P ) , c ó
t h ể x u ấ t h i ệ n t r o n g c á c p h ầ n đ ư ợ c m ã h ó a h a y k h ô n g m ã h ó a
t r o n g h ệ g e n e . S N P s l à c á c b i ế n d ạ n g d ã y D N A x u ấ t h i ệ n k h i
c á c c ơ s ở đ ơ n ( A , C , G , o r T ) đ ư ợ c đ a n x e n s a o c h o c á c c á t h ể
k h á c n h a u c ó c á c c h ữ c á i k h á c n h a u t ạ i c á c v ị t r í n à y .
2 5
F u n c t i o n a l g e n o m i c s
( G e n e h ọ c c h ứ c n ă n g )
G e n e f u n c t i o n s ( C h ứ c n ă n g g e n e )
P r o t e i n a b u n d a n c e i n a c e l l
( S ự d ư t h ừ a p r o t e i n t r o n g t ế b à o )
G e n e r e g u l a t i o n a n d n e t w o r k s
( Đ i ề u k h i ể n g e n e v à m ạ n g g e n e )
G e n e h ọ c c h ứ c n ă n g ( f u n c t i o n a l g e n o m i c s ) c ó t h ể
đ ư ợ c đ ị n h n g h ĩ a n ô m n a n h ư v i ệ c d ù n g t r i t h ứ c t i ê u
b i ể u v ề h ệ g e n e đ ể t ì m h i ể u v ề g e n e s , v ề c á c c h ứ c
n ă n g s ả n x u ấ t v à s ự t ư ơ n g t á c c ủ a c h ú n g , v à q u a n
t r ọ n g h ơ n l à v ì s a o đ i ề u n à y l à m c h o c á c s i n h v ậ t
h o ạ t đ ộ n g .
2 6
F u n c t i o n a l g e n o m i c s G e n e h ọ c c h ứ c n ă n g
D ư ờ n g n h ư c ó m ộ t h ệ h ạ n c h ế c á c g e n e s ( a l i m i t e d u n i v e r s e o f
g e n e s ) v à p r o t e i n s t ư ơ n g ứ n g c ủ a c h ú n g . T ừ q u a n đ i ể m c h ứ c
n ă n g , r ấ t n h i ề u t r o n g c h ú n g c ó t r o n g p h ầ n l ớ n h o ặ c t o à n b ộ h ệ
c á c g e n e s .
S ự d ư t h ừ a p r o t e i n ( p r o t e i n a b u n d a n c e ) c ó t h ể p h ụ t h u ộ c v à o
n h i ề u y ế u t ố n h ư l i ệ u g e n e t ư ơ n g ứ n g c ó đ ư ợ c t h ể h i ệ n
( e x p r e s s e d ) ( i . e . , đ ư ợ c s a o c h é p t í c h c ự c ) h a y k h ô n g , đ ư ợ c t h ể
h i ệ n n h a n h v à m ạ n h t h ế n à o , đ ư ợ c n ố i g h é p , d ị c h c h u y ể n , v à
t h a y đ ổ i n h a n h t h ế n à o , e t c .
T h ể h i ệ n g e n e ( g e n e e x p r e s s i o n ) l à q u á t r ì n h q u a đ ó t h ô n g t i n
m ã h ó a t r o n g m ộ t g e n e đ ư ợ c t r u y ề n v à o c ấ u t r ú c đ a n g c ó t r o n g
t ế b à o v à đ i ề u k h i ể n t ế b à o ( h o ặ c p r o t e i n s h o ặ c R N A s ) .
M ộ t c â u h ỏ i q u a n t r ọ n g v à l ý t h ú k h á c t r o n g s i n h h ọ c l à s ự t h ể
h i ệ n g e n e đ ư ợ c “ b ậ t ” v à “ t ắ t ” t h ế n à o , t ứ c l à c á c g e n e s đ ư ợ c
đ i ề u c h ỉ n h t h ế n à o .
2 7
M i c r o a r r a y s a n d g e n e e x p r e s s i o n
d a t a b a s e s
C ô n g n g h ệ m i c r o a r r a y s ử d ụ n g n g u ồ n t ạ o b ở i c á c đ ề t à i v ề
h ệ g e n e v à c á c n ỗ l ự c v ề d ã y đ ể t r ả l ờ i c â u h ỏ i c á c g e n e s
n à o đ ư ợ c t h ể h i ệ n t r o n g m ộ t k i ể u t ế b à o đ ặ c b i ệ t c ủ a m ộ t
s i n h v ậ t , ở m ộ t t h ờ i đ i ể m đ ặ c b i ệ t , t r o n g n h ữ n g đ i ề u k i ệ n
đ ặ c b i ệ t .
2 8
O u t l i n e
K h á i n i ệ m c ơ b ả n c ủ a s i n h h ọ c
S i n h t i n h ọ c l à g ì ?
V ề m ộ t v à i b à i t o á n t r o n g s i n h t i n h ọ c
B i o i n f o r m a t i c s : t h e m a c h i n e l e a r n i n g a p p r o a c h , P i e r r e B a l d i , S o r e n
B r u n a k , M I T P r e s s 2 0 0 1
B i o i n f o r m a t i c s b a s i c s : a p p l i c a t i o n s i n b i o l o g i c a l s c i e n c e s a n d m e d i c i n e ,
H o o m a n H . R a s h i d i a n d L u k a s K . B u e h l e r , C R C P r e s s , 2 0 0 2
2 9
H u m a n G e n o m e P r o j e c t
D ự á n v ề h ệ g e n e n g ư ờ i
M ụ c t i ê u ( 1 5 n ă m t ừ 1 9 9 0 )
N h ậ n b i ế t ( i d e n t i f y ) t o à n b ộ c h ừ n g
3 0 , 0 0 0 g e n e s t r o n g D N A c ủ a c o n n g ư ờ i .
X á c đ ị n h ( d e t e r m i n e ) c á c d ã y c ủ a 3 t ỷ
c ặ p c ơ s ở t ạ o n ê n D N A c ủ a c o n n g ư ờ i .
L ư u t r ữ ( s t o r e ) t h ô n g t i n n à y t r o n g c á c
c ơ s ở d ữ l i ệ u .
H o à n t h i ệ n ( i m p r o v e ) c á c c ô n g c ụ p h â n
t í c h d ữ l i ệ u .
C h u y ể n g i a o ( t r a n s f e r ) c á c c ô n g n g h ệ
l i ê n q u a n đ ế n c á c d o a n h n g h i ệ p t ư n h â n .
Đ ề c ậ p ( a d d r e s s ) c á c v ấ n đ ề v ề đ ạ o đ ứ c ,
l u ậ t l ệ , v à x ã h ộ i ( E L S I ) c ó t h ể n ả y s i n h
t ừ đ ề t à i .
G e n o m e
H e a l t h
I m p l i c a t i o n
A N e w
D i s e a s e
E n c y c l o p e d i a
N e w G e n e t i c
F i n g e r p r i n t
N e w
D i a g n o s t i c s
N e w
T r e a t m e n t s
3 0
H i s t o r y o f t h e H u m a n G e n o m e P r o j e c t
L ị c h s ử c ủ a d ự á n h ệ g e n e n g ư ờ i
1 9 5 3
W a t s o n ,
C r i c k
D N A
s t r u c t u r e
1 9 7 2
B e r g ,
1 s t
r e c o m b i n a n t
D N A
1 9 7 7
M a x a m ,
G i l b e r t ,
S a n g e r
s e q u e n c e
D N A
1 9 8 0
B o t s t e i n ,
D a v i s ,
S k o l n i c k
W h i t e
p r o p o s e t o
m a p h u m a n
g e n o m e w i t h
R F L P s
1 9 8 2
W a d a
p r o p o s e s t o
b u i l d
a u t o m a t e d
s e q u e n c i n g
r o b o t s
1 9 8 4
M R C
p u b l i s h e s
f i r s t l a r g e
g e n o m e
E p s t e i n - B a r r
v i r u s ( 1 7 0
k b )
1 9 8 5
S i n s h e i m e r
h o s t s
m e e t i n g t o
d i s c u s s H G P
a t U C S a n t a
C r u z ;
K a r y M u l l i s
d e v e l o p s
P C R
1 9 8 6
D O E b e g i n s
g e n o m e
s t u d i e s w i t h
$ 5 . 3 m i l l i o n
1 9 8 7
G i l b e r t a n n o u n c e s
p l a n s t o s t a r t c o m p a n y
t o s e q u e n c e a n d
c o p y r i g h t D N A ; B u r k e ,
O l s o n , C a r l e d e v e l o p
Y A C s ; D o n i s - K e l l e r
p u b l i s h f i r s t m a p ( 4 0 3
m a r k e r s )
3 1
H i s t o r y o f t h e H u m a n G e n o m e P r o j e c t
L ị c h s ử c ủ a d ự á n h ệ g e n e n g ư ờ i ( t i ế p )
1 9 8 7 ( c o n t )
H o o d
p r o d u c e s
f i r s t
a u t o m a t e d
s e q u e n c e r ;
D u p o n t
d e v o l o p s
f l u o r e s c e n t
d i d e o x y -
n u c l e o t i d e s
1 9 8 8
N I H
s u p p o r t s t h e
H G P ;
W a t s o n
h e a d s t h e
p r o j e c t a n d
a l l o c a t e s
p a r t o f t h e
b u d g e t t o
s t u d y s o c i a l
a n d e t h i c a l
i s s u e s
1 9 8 9
H o o d ,
O l s o n ,
B o t s t e i n
C a n t o r
p r o p o s e
u s i n g
S T S ’ s t o
m a p t h e
h u m a n
g e n o m e
1 9 9 0
P r o p o s a l
t o s e q u e n c e
2 0 M b i n
m o d e l
o r g a n i s m b y
2 0 0 5 ;
L i p m a n ,
M y e r s
p u b l i s h t h e
B L A S T
a l g o r i t h m
1 9 9 1
V e n t e r
a n n o u n c e s
s t r a t e g y t o
s e q u e n c e
E S T s . H e
p l a n s t o
p a t e n t
p a r t i a l
c D N A s ;
U b e r b a c h e r
d e v e l o p s
G R A I L , a
g e n e f i n d i n g
p r o g r a m
1 9 9 2
S i m o n
d e v e l o p s
B A C s ; U S
a n d F r e n c h
t e a m s
p u b l i s h f i r s t
p h y s i c a l
m a p s o f
c h r o m o s o m e
s ; f i r s t
g e n e t i c m a p s
o f m o u s e a n d
h u m a n
g e n o m e
p u b l i s h e d
1 9 9 3
C o l l i n s i s
n a m e d
d i r e c t o r
o f
N C H G R ;
r e v i s e
p l a n t o
c o m p l e t e
s e q o f
h u m a n
g e n o m e
b y 2 0 0 5
1 9 9 5
V e n t e r
p u b l i s h e s
f i r s t
s e q u e n c e o f
f r e e - l i v i n g
o r g a n i s m :
H . i n f l u e n z a e
( 1 . 8 M b ) ;
B r o w n
p u b l i s h e s o n
D N A a r r a y s
1 9 9 6
Y e a s t
g e n o m e i s
s e q u e n c e d ( S .
c e r e v i s i a e )
3 2
H i s t o r y o f t h e H u m a n G e n o m e P r o j e c t
L ị c h s ử c ủ a d ự á n h ệ g e n e n g ư ờ i ( t i ế p )
1 9 9 7
B l a t t n e r ,
P l u n k e t
c o m p l e t e E .
c o l i
s e q u e n c e ; a
c a p i l l a r y
s e q u e n c i n g
m a c h i n e i s
i n t r o d u c e d .
1 9 9 8
S N P p r o j e c t
i s i n i t i a t e d ;
r i c e g e n o m e
p r o j e c t i s
s t a r t e d ;
V e n t e r
c r e a t e s n e w
c o m p a n y
c a l l e d C e l e r a
a n d p r o p o s e s
t o s e q u e n c e
H G w i t h i n 3
y e a r s ; C .
e l e g a n s
g e n o m e
c o m p l e t e d
1 9 9 9
N I H
p r o p o s e s t o
s e q u e n c e
m o u s e
g e n o m e i n 3
y e a r s ; f i r s t
s e q u e n c e o f
c h r o m o s o m e
2 2 i s
a n n o u n c e d
2 0 0 0
C e l e r a a n d
o t h e r s
p u b l i s h
D r o s p h i l a
s e q u e n c e
( 1 8 0 M b ) ;
h u m a n
c h r o m o s o m e
2 1 i s
c o m p l e t e l y
s e q u e n c e d ;
p r o p o s a l t o
s e q u e n c e
p u f f e r f i s h ;
A r a b a d o p s i s
s e q u e n c e i s
c o m p l e t e d
2 0 0 1
C e l e r a
p u b l i s h e s
h u m a n
s e q u e n c e i n
S c i e n c e ; t h e
H G P
c o n s o r t i u m
p u b l i s h e s t h e
h u m a n
s e q u e n c e i n
N a t u r e
h t t p : / / w w w . d - t r e n d s . c o m / B i o i n f o r m a t i c s / t i m e l i n e . h t m l
2 0 0 3
C o m p l e t e l y
s e q u e n c e d
h u m a n
g e n o m e .
3 3
W h a t i s b i o i n f o r m a t i c s ?
T i n s i n h h ọ c l à g ì ?
B i o : S i n h h ọ c p h â n t ử ( M o l e c u l a r B i o l o g y )
I n f o r m a t i c s : K h o a h ọ c t í n h t o á n
B i o i n f o r m a t i c s : G i ả i q u y ế t c á c b à i t o á n
s i n h h ọ c b ằ n g v i ệ c s ử d ụ n g c á c p h ư ơ n g
p h á p c ủ a k h o a h ọ c t í n h t o á n .
S y n o n y m s : C o m p u t a t i o n a l b i o l o g y ,
C o m p u t a t i o n a l m o l e c u l a r b i o l o g y ,
B i o c o m p u t i n g
3 4
T h a y đ ổ i t r o n g s i n h h ọ c
P a r a d i g m s h i f t i n b i o l o g y
M ộ t k i ể u t h ứ c m ớ i đ a n g x u ấ t h i ệ n l à t ấ t c ả c á c ‘ g e n e s ’ s ẽ s ớ m đ ư ợ c
b i ế t h ế t ( t h e o n g h ĩ a c ó t r o n g c á c c ơ s ở d ữ l i ệ u đ i ệ n t ử ) , v à n g h ĩ a l à
đ i ể m b ắ t đ ầ u c ủ a m ộ t k h ả o s á t s i n h h ọ c s ẽ l à l ý t h u y ế t . M ỗ i n h à k h o a
h ọ c s ẽ k h ở i đ ầ u b ằ n g m ộ t ư ớ c đ o á n l ý t h u y ế t , r ồ i m ớ i c h u y ể n q u a
l à m t h í n g h i ệ m đ ể t h e o h o ặ c k i ể m t r a g i ả t h u y ế t .
Đ ể d ù n g d ò n g c h ả y t r i t h ứ c t r ê n c á c m ạ n g t o à n c ầ u , c á c n h à s i n h h ọ c
k h ô n g n h ữ n g p h ả i b i ế t d ù n g m á y t í n h , m à c ò n p h ả i t h a y đ ổ i c á c h
t i ế p c ậ n c ủ a m ì n h đ ố i v ớ i b à i t o á n h i ể u s ự s ố n g .
T h e n e w p a r a d i g m , n o w e m e r g i n g , i s t h a t a l l t h e ‘ g e n e s ’ w i l l b e k n o w n ( i n t h e s e n s e o f b e i n g r e s i d e n t i n d a t a b a s e s a v a i l a b l e e l e c t r o n i c a l l y ) ,
a n d t h a t t h e s t a r t i n g p o i n t o f a b i o l o g i c a l i n v e s t i g a t i o n w i l l b e t h e o r e t i c a l . A n i n d i v i d u a l s c i e n t i s t w i l l b e g i n w i t h a t h e o r e t i c a l c o n j e c t u r e ,
o n l y t h e n t u r n i n g t o e x p e r i m e n t t o f o l l o w o r t e s t t h a t h y p o t h e s i s .
T o u s e [ t h e ] f l o o d o f k n o w l e d g e , w h i c h w i l l p o u r a c r o s s t h e c o m p u t e r n e t w o r k s o f t h e w o r l d , b i o l o g i s t s n o t o n l y m u s t b e c o m e c o m p u t e r
l i t e r a t e , b u t a l s o c h a n g e t h e i r a p p r o a c h t o t h e p r o b l e m o f u n d e r s t a n d i n g l i f e .
M ộ t k i ể u t h ứ c m ớ i đ a n g x u ấ t h i ệ n l à t ấ t c ả c á c ‘ g e n e s ’ s ẽ s ớ m đ ư ợ c
b i ế t h ế t ( t h e o n g h ĩ a c ó t r o n g c á c c ơ s ở d ữ l i ệ u đ i ệ n t ử ) , v à n g h ĩ a l à
đ i ể m b ắ t đ ầ u c ủ a m ộ t k h ả o s á t s i n h h ọ c s ẽ l à l ý t h u y ế t . M ỗ i n h à k h o a
h ọ c s ẽ k h ở i đ ầ u b ằ n g m ộ t ư ớ c đ o á n l ý t h u y ế t , r ồ i ớ i c h u y ể n q u a
l à t h í n g h i ệ đ ể t h e o h o ặ c k i ể m t r a g i ả t h u y ế t .
Đ ể d ù n g d ò n g c h ả y t r i t h ứ c t r ê n c á c m ạ n g t o à n c ầ u , c á c n h à s i n h h ọ c
k h ô n g n h ữ n g p h ả i b i ế t d ù n g á y t í n h , m à c ò n p h ả i t h a y đ ổ i c á c h
t i ế p c ậ n c ủ a ì n h đ ố i v ớ i b à i t o á n h i ể u s ự s ố n g .
T h e n e w p a r a d i g m , n o w e m e r g i n g , i s t h a t a l l t h e ‘ g e n e s ’ w i l l b e k n o w n ( i n t h e s e n s e o f b e i n g r e s i d e n t i n d a t a b a s e s a v a i l a b l e e l e c t r o n i c a l l y ) ,
a n d t h a t t h e s t a r t i n g p o i n t o f a b i o l o g i c a l i n v e s t i g a t i o n w i l l b e t h e o r e t i c a l . A n i n d i v i d u a l s c i e n t i s t w i l l b e g i n w i t h a t h e o r e t i c a l c o n j e c t u r e ,
o n l y t h e n t u r n i n g t o e x p e r i m e n t t o f o l l o w o r t e s t t h a t h y p o t h e s i s .
T o u s e [ t h e ] f l o o d o f k n o w l e d g e , w h i c h w i l l p o u r a c r o s s t h e c o m p u t e r n e t w o r k s o f t h e w o r l d , b i o l o g i s t s n o t o n l y m u s t b e c o m e c o m p u t e r
l i t e r a t e , b u t a l s o c h a n g e t h e i r a p p r o a c h t o t h e p r o b l e m o f u n d e r s t a n d i n g l i f e .
W a l t e r G i l b e r t . 1 9 9 1 . T o w a r d s a p a r a d i g m s h i f t i n b i o l o g y . N a t u r e , 3 4 9 : 9 9 .
W a l t e r G i l b e r t . 1 9 9 1 . T o w a r d s a p a r a d i g m s h i f t i n b i o l o g y . N a t u r e , 3 4 9 : 9 9 .
3 5
B a s e P a i r s i n G e n B a n k
1 0 , 2 6 7 , 5 0 7 , 2 8 2
b a s e s i n
9 , 0 9 2 , 7 6 0
r e c o r d s .
3 6
P u b l i c d a t a b a s e s
3 7
M ở r ộ n g c á c k h á i n i ệ m c ủ a T i n s i n h h ọ c
G e n e h ọ c ( g e n o m i c s )
G e n e h ọ c c h ứ c n ă n g
G e n e h ọ c c ấ u t r ú c
P r o t e i n h ọ c ( P r o t e o m i c s ) :
P h â n t í c h p r o t e i n s c ủ a m ộ t
s i n h v ậ t ở n h i ề u m ứ c ( l a r g e
s c a l e )
G e n e d ư ợ c h ọ c
( P h a r m a c o g e n o m i c s ) : P h á t
t r i ể n c á c t h u ố c m ớ i n h ằ m
đ ế n c á c b ệ n h đ ặ c b i ệ t
M i c r o a r r a y ( g e n o m e c h i p ) :
D N A c h i p , p r o t e i n c h i p
X á c đ ị n h v à đ ặ c t r ư n g c h ứ c
n ă n g c ủ a g e n e s .
N g h i ê n c ứ u t h ể h i ệ n g e n e ở m ọ i
m ứ c c ủ a p r o t e i n b ở i đ ồ n g n h ấ t v à
đ ặ t t r ư n g p r o t e i n s c ó t r o n g c á c
m ẫ u s i n h h ọ c .
D ù n g t h ô n g t i n v ề g e n e đ ể d ự
đ o á n s ự a n t o à n , đ ộ c t í n h v à / h o ặ c
h i ệ u q u ả c ủ a t h u ố c v ớ i n g ư ờ i
b ệ n h h o ặ c n h ó m n g ư ờ i b ệ n h .
M ộ t c ô n g n g h ệ m ớ i n h ằ m đ ư a t o à n
b ộ h ệ g e n e t r ê n m ộ t c h i p s a o c h o
c á c n g h i ê n c ứ u v i ê n c ó m ộ t b ứ c
t r a n h t ố t h ơ n v ề t ư ơ n g t á c đ ồ n g
t h ờ i c ủ a h à n g n g à n g e n e s
3 8
P r o b l e m s i n B i o i n f o r m a t i c s
P h â n t í c h c ấ u t r ú c
S o s á n h c ấ u t r ú c p r o t e i n
D ự đ o á n c ấ u t r ú c p r o t e i n
M ô h ì n h h ó a c ấ u t r ú c R N A
0 1 , 0 0 0 2 , 0 0 0 3 , 0 0 0 4 , 0 0 0
4 , 0 0 03 , 0 0 02 , 0 0 01 , 0 0 00
2 . 0
1 . 5
1 . 0
0 . 5
- 0 . 0
2 . 0
1 . 5
1 . 0
0 . 5
- 0 . 0
2 . 0
1 . 5
1 . 0
0 . 5
- 0 . 0
7 6 8 T T . . . . T G T G T G C A T T T A A G G G T G A T A G T G T A T T T G C T C T T T A A G A G C T G 8 1 3
| | | | | | | | | | | | | | | | | | | | | | | | | | |
8 7 T T G A C A G G T A C C C A A C T G T G T G T G C T G A T G T A . T T G C T G G C C A A G G A C T G 1 3 5
. . . . .
8 1 4 A G T G T T T G A G C C T C T G T T T G T G T G T A A T T G A G T G T G C A T G T G T G G G A G T G 8 6 3
| | | | | | | | | | | | | | | | | | | |
1 3 6 A A G G A T C . . . . . . . . . . . . . T C A G T A A T T A A T C A T G C A C C T A T G T G G C G G 1 7 2
. . . . .
8 6 4 A A A T T G T G G A A T G T G T A T G C T C A T A G C A C T G A G T G A A A A T A A A A G A T T G T 9 1 3
| | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |
1 7 3 A A A . T A T G G G A T A T G C A T G T C G A . . . C A C T G A G T G . . A A G G C A A G A T T A T 2 1 6
P h â n t í c h đ ư ờ n g c h u y ể n h ó a
Đ ư ờ n g t r a o đ ổ i c h ấ t ( m e t a b o l i c p a t h w a y )
M ạ n g đ i ề u t i ế t ( r e g u l a t o r y n e t w o r k s )
P h â n t í c h d ã y
S ắ p d ã y ( s e q u e n c e a l i g n m e n t )
D ự đ o á n c h ứ c n ă n g v à c ấ u t r ú c
T ì m g e n e ( G e n e f i n d i n g )
P h â n t í c h t h ể h i ệ n
P h â n t í c h t h ể h i ệ n g e n e
P h â n n h ó m g e n e
3 9
P a t h w a y a n a l y s i s
M ỗ i p h ả n ứ n g h ó a h ọ c
h o á n c h u y ể n
( i n t e r c o n v e r t s ) c á c t h à n h
p h ầ n h ó a h ọ c
M ộ t e n z y m e l à m ộ t
p r o t e i n c ó c h ứ c n ă n g
t h ú c đ ẩ y c á c p h ả n ứ n g
h ó a h ọ c
M ộ t đ ư ờ n g c h u y ể n h ó a
( p a t h w a y ) l à m ộ t t ậ p
c á c p h ả n ứ n g h ó a h ọ c
đ ư ợ c n ố i v ớ i n h a u .
4 0
A n o v e r v i e w o f
s e q u e n c e a n a l y s i s
N u c l e o t i d e s e q u e n c e f i l e
S e a r c h d a t a b a s e s f o r
s i m i l a r s e q u e n c e s
S e q u e n c e c o m p a r i s o n
M u l t i p l e s e q u e n c e a n a l y s i s
D e s i g n f u r t h e r e x p e r i m e n t s
z R e s t r i c t i o n m a p p i n g
z P C R p l a n n i n g
T r a n s l a t e
i n t o p r o t e i n
S e a r c h f o r
k n o w n m o t i f s
R N A s t r u c t u r e
p r e d i c t i o n
n o n - c o d i n g
c o d i n g
P r o t e i n
s e q u e n c e
a n a l y s i s
S e a r c h f o r p r o t e i n
c o d i n g r e g i o n s
M a n u a l
s e q u e n c e e n t r y
S e q u e n c e
d a t a b a s e b r o w s i n g
S e q u e n c i n g p r o j e c t
m a n a g e m e n t
P r o t e i n s e q u e n c e f i l e
S e a r c h d a t a b a s e s f o r
s i m i l a r s e q u e n c e s
S e q u e n c e c o m p a r i s o n
S e a r c h f o r
k n o w n m o t i f s
P r e d i c t
s e c o n d a r y
s t r u c t u r e
P r e d i c t
t e r t i a r y
s t r u c t u r e
C r e a t e a m u l t i p l e
s e q u e n c e a l i g n m e n t
E d i t t h e a l i g n m e n t
F o r m a t t h e a l i g n m e n t
f o r p u b l i c a t i o n
M o l e c u l a r
p h y l o g e n y
P r o t e i n f a m i l y
a n a l y s i s
N u c l e o t i d e
s e q u e n c e
a n a l y s i s
S e q u e n c e
e n t r y
4 1
P r i m a r y p u b l i c d o m a i n b i o i n f o r m a t i c s
s e r v e r s
P u b l i c D o m a i n
B i o i n f o r m a t i c s
F a c i l i t i e s
E u r o p e a n B i o i n f o r m a t i c s
I n s t i t u t e ( E B I )
U n i t e d K i n g d o m
N a t i o n a l C e n t e r
F o r B i o t e c h n o l o g y
I n f o r m a t i o n ( N C B I )
U n i t e d S t a t e s
G e n o m e
N e t
( K E G G & D D B J )
J a p a n
D a t a b a s e s
A n a l y s i s
T o o l s
D a t a b a s e s
A n a l y s i s
T o o l s
D a t a b a s e s
A n a l y s i s
T o o l s
4 2
A n a l y s i s T o o l s C ô n g c ụ p h â n t í c h
E B I l o c á c v e r s i o n s đ ể
t ì m c á c c ơ s ở d ữ l i ệ u
t r o n g c á c l ĩ n h v ự c
c ô n g c ộ n g c h ủ y ế u v à
c á c c ô n g c ụ p h â n t í c h
n h ư F A S T A ,
C L U S T A L W , B L A S T , v à
c á c c à i đ ặ t c ủ a S m i t h
& W a t e r m a n .
4 3
C h a l l e n g e s i n B i o i n f o r m a t i c s
T i n s i n h h ọ c đ ò i h ỏ i :
T r u y n h ậ p v à o đ ư ợ c n h i ề u n g u ồ n p h â n t á n
( A c c e s s t o m u l t i p l e d i s t r i b u t e d r e s o u r c e s )
C ầ n t h ô n g t i n đ ư ợ c c ậ p n h ậ t
( N e e d s i n f o r m a t i o n t o b e u p - t o - d a t e )
D ư t h ừ a d ữ l i ệ u t ố i t h i ể u ( M i n i m a l d a t a r e d u n d a n c y )
C á c ứ n g d ụ n g ổ n đ ị n h ( R o b u s t a p p l i c a t i o n s )
C á c ứ n g d ụ n g m ở r ộ n g đ ư ợ c
( E x t e n d a b l e a p p l i c a t i o n s )
M o n o l i t h i c A p p . v s . C o m p o n e n t s
C á c p h ầ n m ề m c h u y ể n t ả i đ ư ợ c ( P o r t a b l e s o f t w a r e )
4 4
B ù n g n ổ t h ô n g t i n
C ầ n p h â n t í c h đ ư ợ c n h a n h , t ự đ ộ n g đ ể x ử l ý đ ư ợ c
l ư ợ n g t h ô n g t i n l ớ n
C ầ n t í c h h ợ p đ ư ợ c n h i ề u k i ể u t h ô n g t i n k h á c n h a u
( s e q u e n c e s , l i t e r a t u r e , a n n o t a t i o n s , p r o t e i n l e v e l s ,
R N A l e v e l s e t c )
C ầ n c á c p h ầ n m ề m “ t h ô n g m i n h h ơ n ” đ ể n h ậ n b i ế t
đ ư ợ c c á c q u a n h ệ q u a n t r ọ n g t r o n g c á c t ậ p d ữ l i ệ u r ấ t
l ớ n .
T h i ế u c á c “ n h à t i n s i n h h ọ c ” ( “ b i o i n f o r m a t i c i a n s ” )
P h ầ n m ề m c ầ n d ễ t r u y n h ậ p , d ễ d ù n g v à d ễ h i ể u h ơ n
N h à s i n h h ọ c c ầ n h ọ c p h ầ n m ề m , t h ấ y h ạ n c h ế c ủ a
c h ú n g , v à c á c h g i ả i t h í c h k ế t q u ả c ủ a c h ú n g .
C h a l l e n g e s i n B i o i n f o r m a t i c s
4 5
O u t l i n e
K h á i n i ệ m c ơ b ả n c ủ a s i n h h ọ c
S i n h t i n h ọ c
Các file đính kèm theo tài liệu này:
- giao_trinh_gioi_thieu_ve_tin_sinh_hoc.pdf