Giáo trình Giới thiệu về tin sinh học

What is bioinformatics?

Tin sinh học là gì?

 Bio: Sinh học phân tử (Molecular Biology)

 Informatics: Khoa học tính toán

 Bioinformatics: Giải quyết các bài toán

sinh học bằng việc sử dụng các phương

pháp của khoa học tính toán.

Synonyms: Computational biology,

Computational molecular biology,

Biocomputing

34

Thay đổi trong sinh học

Paradigm shift in biology

Một kiểu thức mới đang xuất hiện là tất cả các ‘genes’ sẽ sớm được

biết hết (theo nghĩa có trong các cơ sở dữ liệu điện tử), và nghĩa là

điểm bắt đầu của một khảo sát sinh học sẽ là lý thuyết. Mỗi nhà khoa

học sẽ khởi đầu bằng một ước đoán lý thuyết, rồi mới chuyển qua

làm thí nghiệm để theo hoặc kiểm tra giả thuyết.

Để dùng dòng chảy tri thức trên các mạng toàn cầu, các nhà sinh học

không những phải biết dùng máy tính, mà còn phải thay đổi cách

tiếp cận của mình đối với bài toán hiểu sự sống.

The new paradigm, now emerging, is that all the ‘genes’ will be known (in the sense of being resident in databases available electronically),

and that the starting point of a biological investigation will be theoretical. An individual scientist will begin with a theoretical conjecture,

only then turning to experiment to follow or test that hypothesis.

To use [the] flood of knowledge, which will pour across the computer networks of the world, biologists not only must become compute

pdf32 trang | Chia sẻ: trungkhoi17 | Lượt xem: 516 | Lượt tải: 3download
Bạn đang xem trước 20 trang tài liệu Giáo trình Giới thiệu về tin sinh học, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
i t ế b à o p h â n c h i a . 2 0 C h r o m o s o m e s , g e n o m e s a n d s e q u e n c i n g N h i ễ m s ắ c t h ể , h ệ g e n e , v à s ắ p d ã y „ X á c đ ị n h d ã y b ố n c h ữ c á i c ủ a m ộ t p h â n t ử D N A c h o t r ư ớ c g ọ i l à s ắ p d ã y D N A ( D N A s e q u e n c i n g ) . … B ộ g e n e c ủ a m ộ t v i k h u ẩ n ( a b a c t e r i u m ) đ ư ợ c s ắ p d ã y t o à n b ộ n ă m 1 9 9 5 . B ộ g e n e c ủ a ( y e a s t ) g đ ư ợ c s ắ p d ã y n ă m 1 9 9 7 , g i u n ( w o r m ) n ă m 1 9 9 9 , r u ồ i ( f l y ) n ă m 2 0 0 0 , v à c ỏ d ạ i ( w e e d ) n ă m 2 0 0 1 . … V i ệ c s ắ p d ã y t o à n b ộ h ệ g e n e c o n n g ư ờ i đ ư ợ c h o à n t h à n h n ă m 2 0 0 3 , đ ư ợ c b i ế t n h ư h ệ g e n e n g ư ờ i ( h u m a n g e n o m e ) . „ C á c h ệ g e n e đ ề u c h ứ a g e n e , v à p h ầ n l ớ n c h ú n g m ã h ó a p r o t e i n s . 2 1 G e n e s v à s ự t ổ n g h ợ p p r o t e i n „ G e n e s l à c á c đ o ạ n đ ặ c b i ệ t c ủ a D N A c ó c h ứ c n ă n g đ i ề u k h i ể n c ấ u t r ú c v à h o ạ t đ ộ n g c ủ a t ế b à o ; l à đ ơ n v ị c h ứ c n ă n g c ủ a s ự d i t r u y ề n . „ Đ ể h i ể u r õ h ơ n v ề g e n e , t a c ầ n m ô t ả c ơ c h ế t ạ o r a p r o t e i n s d ự a t r ê n t h ô n g t i n đ ư ợ c m ã h ó a t r o n g g e n e s . Q u á t r ì n h n à y đ ư ợ c g ọ i l à s ự t ổ n g h ợ p p r o t e i n s , v à g ồ m b a g i a i đ o ạ n c h í n h : 1 . T r a n s c r i p t i o n ( p h i ê n m ã ) 2 . S p l i c i n g ( g h é p m ã ) 3 . T r a n s l a t i o n ( d ị c h m ã ) . 2 2 T ổ n g h ợ p p r o t e i n B ỏ đ i v à i m ẩ u c ủ a p r e m R N A , g ọ i l à i n t r o n s , p h ầ n c ò n l ạ i , g ọ i l à e x o n s , s ẽ đ ư ợ c n ố i v ớ i n h a u . S ố l ư ợ n g v à k í c h t h ư ớ c c á c i n t r o n s v à e x o n s k h á c n h a u r ấ t đ á n g k ể c á c g e n e s c ũ n g n h ư g i ữ a c á c c h ủ n g l o ạ i . T ạ o p r o t e i n s b ằ n g c á c h n ố i c á c a m i n o a c i d s t h e o t h ứ t ự đ ự ợ c m ã h ó a t r o n g m R N A . T h ứ t ự c ủ a a m i n o a c i d s đ ư ợ c x á c đ ị n h b ở i 3 đ ơ n p h â n t ử k ề n h a u t r o n g D N A , g ọ i l à b ộ b a h o ặ c m ã d i t r u y ề n ( t r i p l e t o r g e n e t i c c o d e ) . M ỗ i b ộ b a đ ư ợ c g ọ i l à c o d o n v à m ã c h o m ộ t a m i n o a c i d . M ộ t đ o ạ n p h â n t ử D N A đ ư ợ c s a o c h é p v à o m R N A b ổ s u n g ( p h i ê n m ã ) S ự d ị c h m ã l à m ộ t q u á t r ì n h p h ứ c t ạ p v à n h i ề u c h i t i ế t c h ư a đ ư ợ c b i ế t . 2 3 B à i t o á n đ o á n n h ậ n g e n e G e n e p r e d i c t i o n p r o b l e m „ G e n e p r e d i c t i o n : C h o m ộ t d ã y D N A , h ã y n ó i g e n e ở đ â u t r o n g d ã y n à y ? < 5 %3 0 , 0 0 0H u m a n 2 0 %2 5 , 5 0 0W e e d 2 0 %1 4 , 0 0 0F l y ( r u ồ i ) 2 7 %1 8 , 0 0 0W o r m ( g i u n ) 7 0 %6 0 0 0Y e a s t ( m e n ) 9 0 %5 0 0 0E . C o l i ( b a c t e r i a ) P h ầ n c ủ a h ệ g e n e m ã h ó a p r o t e i n s ( e x o n s ) S ố g e n e s đ ã đ ư ợ c đ o á n n h ậ n S i n h v ậ t 2 4 S ự t ư ơ n g t ự c ủ a h ệ g e n e v à S N F s G e n o m e s i m i l a r i t y a n d S N P s „ M ọ i h ệ g e n e c ủ a n g ư ờ i đ ư ợ c x e m l à t ư ơ n g đ ư ơ n g đ ế n 9 9 . 9 % v à t r u n g b ì n h g i ữ a c á c h ệ g e n e s c ủ a h a i c á t h ể k h á c n h a u c ứ m ộ t n g h ì n đ ơ n p h â n t ử c h ỉ c ó m ộ t k h á c n h a u . „ S ự b i ế n d ạ n g t r o n g c á c p h ầ n k h ô n g m ã h ó a c ủ a h ệ g e n e đ ư ợ c p h â n t í c h đ ể đ ể t ạ o r a c á c d ạ n g ( p a t t e r n s ) t i n c ậ y đ ể p h â n b i ệ t c á c c a t h ể . „ C á c b i ế n d ạ n g đ ặ c b i ệ t q u a n t r ọ n g t r o n g h ệ g e n e l à đ a đ ẳ n g đ ơ n p h â n t ử ( s i n g l e n u c l e o t i d e p o l y m o r p h i s m s ( S N P ) , c ó t h ể x u ấ t h i ệ n t r o n g c á c p h ầ n đ ư ợ c m ã h ó a h a y k h ô n g m ã h ó a t r o n g h ệ g e n e . S N P s l à c á c b i ế n d ạ n g d ã y D N A x u ấ t h i ệ n k h i c á c c ơ s ở đ ơ n ( A , C , G , o r T ) đ ư ợ c đ a n x e n s a o c h o c á c c á t h ể k h á c n h a u c ó c á c c h ữ c á i k h á c n h a u t ạ i c á c v ị t r í n à y . 2 5 F u n c t i o n a l g e n o m i c s ( G e n e h ọ c c h ứ c n ă n g ) „ G e n e f u n c t i o n s ( C h ứ c n ă n g g e n e ) „ P r o t e i n a b u n d a n c e i n a c e l l ( S ự d ư t h ừ a p r o t e i n t r o n g t ế b à o ) „ G e n e r e g u l a t i o n a n d n e t w o r k s ( Đ i ề u k h i ể n g e n e v à m ạ n g g e n e ) G e n e h ọ c c h ứ c n ă n g ( f u n c t i o n a l g e n o m i c s ) c ó t h ể đ ư ợ c đ ị n h n g h ĩ a n ô m n a n h ư v i ệ c d ù n g t r i t h ứ c t i ê u b i ể u v ề h ệ g e n e đ ể t ì m h i ể u v ề g e n e s , v ề c á c c h ứ c n ă n g s ả n x u ấ t v à s ự t ư ơ n g t á c c ủ a c h ú n g , v à q u a n t r ọ n g h ơ n l à v ì s a o đ i ề u n à y l à m c h o c á c s i n h v ậ t h o ạ t đ ộ n g . 2 6 F u n c t i o n a l g e n o m i c s G e n e h ọ c c h ứ c n ă n g „ D ư ờ n g n h ư c ó m ộ t h ệ h ạ n c h ế c á c g e n e s ( a l i m i t e d u n i v e r s e o f g e n e s ) v à p r o t e i n s t ư ơ n g ứ n g c ủ a c h ú n g . T ừ q u a n đ i ể m c h ứ c n ă n g , r ấ t n h i ề u t r o n g c h ú n g c ó t r o n g p h ầ n l ớ n h o ặ c t o à n b ộ h ệ c á c g e n e s . „ S ự d ư t h ừ a p r o t e i n ( p r o t e i n a b u n d a n c e ) c ó t h ể p h ụ t h u ộ c v à o n h i ề u y ế u t ố n h ư l i ệ u g e n e t ư ơ n g ứ n g c ó đ ư ợ c t h ể h i ệ n ( e x p r e s s e d ) ( i . e . , đ ư ợ c s a o c h é p t í c h c ự c ) h a y k h ô n g , đ ư ợ c t h ể h i ệ n n h a n h v à m ạ n h t h ế n à o , đ ư ợ c n ố i g h é p , d ị c h c h u y ể n , v à t h a y đ ổ i n h a n h t h ế n à o , e t c . „ T h ể h i ệ n g e n e ( g e n e e x p r e s s i o n ) l à q u á t r ì n h q u a đ ó t h ô n g t i n m ã h ó a t r o n g m ộ t g e n e đ ư ợ c t r u y ề n v à o c ấ u t r ú c đ a n g c ó t r o n g t ế b à o v à đ i ề u k h i ể n t ế b à o ( h o ặ c p r o t e i n s h o ặ c R N A s ) . M ộ t c â u h ỏ i q u a n t r ọ n g v à l ý t h ú k h á c t r o n g s i n h h ọ c l à s ự t h ể h i ệ n g e n e đ ư ợ c “ b ậ t ” v à “ t ắ t ” t h ế n à o , t ứ c l à c á c g e n e s đ ư ợ c đ i ề u c h ỉ n h t h ế n à o . 2 7 M i c r o a r r a y s a n d g e n e e x p r e s s i o n d a t a b a s e s C ô n g n g h ệ m i c r o a r r a y s ử d ụ n g n g u ồ n t ạ o b ở i c á c đ ề t à i v ề h ệ g e n e v à c á c n ỗ l ự c v ề d ã y đ ể t r ả l ờ i c â u h ỏ i c á c g e n e s n à o đ ư ợ c t h ể h i ệ n t r o n g m ộ t k i ể u t ế b à o đ ặ c b i ệ t c ủ a m ộ t s i n h v ậ t , ở m ộ t t h ờ i đ i ể m đ ặ c b i ệ t , t r o n g n h ữ n g đ i ề u k i ệ n đ ặ c b i ệ t . 2 8 O u t l i n e „ K h á i n i ệ m c ơ b ả n c ủ a s i n h h ọ c „ S i n h t i n h ọ c l à g ì ? „ V ề m ộ t v à i b à i t o á n t r o n g s i n h t i n h ọ c ™ B i o i n f o r m a t i c s : t h e m a c h i n e l e a r n i n g a p p r o a c h , P i e r r e B a l d i , S o r e n B r u n a k , M I T P r e s s 2 0 0 1 ™ B i o i n f o r m a t i c s b a s i c s : a p p l i c a t i o n s i n b i o l o g i c a l s c i e n c e s a n d m e d i c i n e , H o o m a n H . R a s h i d i a n d L u k a s K . B u e h l e r , C R C P r e s s , 2 0 0 2 2 9 H u m a n G e n o m e P r o j e c t D ự á n v ề h ệ g e n e n g ư ờ i M ụ c t i ê u ( 1 5 n ă m t ừ 1 9 9 0 ) „ N h ậ n b i ế t ( i d e n t i f y ) t o à n b ộ c h ừ n g 3 0 , 0 0 0 g e n e s t r o n g D N A c ủ a c o n n g ư ờ i . „ X á c đ ị n h ( d e t e r m i n e ) c á c d ã y c ủ a 3 t ỷ c ặ p c ơ s ở t ạ o n ê n D N A c ủ a c o n n g ư ờ i . „ L ư u t r ữ ( s t o r e ) t h ô n g t i n n à y t r o n g c á c c ơ s ở d ữ l i ệ u . „ H o à n t h i ệ n ( i m p r o v e ) c á c c ô n g c ụ p h â n t í c h d ữ l i ệ u . „ C h u y ể n g i a o ( t r a n s f e r ) c á c c ô n g n g h ệ l i ê n q u a n đ ế n c á c d o a n h n g h i ệ p t ư n h â n . „ Đ ề c ậ p ( a d d r e s s ) c á c v ấ n đ ề v ề đ ạ o đ ứ c , l u ậ t l ệ , v à x ã h ộ i ( E L S I ) c ó t h ể n ả y s i n h t ừ đ ề t à i . G e n o m e H e a l t h I m p l i c a t i o n A N e w D i s e a s e E n c y c l o p e d i a N e w G e n e t i c F i n g e r p r i n t N e w D i a g n o s t i c s N e w T r e a t m e n t s 3 0 H i s t o r y o f t h e H u m a n G e n o m e P r o j e c t L ị c h s ử c ủ a d ự á n h ệ g e n e n g ư ờ i 1 9 5 3 W a t s o n , C r i c k D N A s t r u c t u r e 1 9 7 2 B e r g , 1 s t r e c o m b i n a n t D N A 1 9 7 7 M a x a m , G i l b e r t , S a n g e r s e q u e n c e D N A 1 9 8 0 B o t s t e i n , D a v i s , S k o l n i c k W h i t e p r o p o s e t o m a p h u m a n g e n o m e w i t h R F L P s 1 9 8 2 W a d a p r o p o s e s t o b u i l d a u t o m a t e d s e q u e n c i n g r o b o t s 1 9 8 4 M R C p u b l i s h e s f i r s t l a r g e g e n o m e E p s t e i n - B a r r v i r u s ( 1 7 0 k b ) 1 9 8 5 S i n s h e i m e r h o s t s m e e t i n g t o d i s c u s s H G P a t U C S a n t a C r u z ; K a r y M u l l i s d e v e l o p s P C R 1 9 8 6 D O E b e g i n s g e n o m e s t u d i e s w i t h $ 5 . 3 m i l l i o n 1 9 8 7 G i l b e r t a n n o u n c e s p l a n s t o s t a r t c o m p a n y t o s e q u e n c e a n d c o p y r i g h t D N A ; B u r k e , O l s o n , C a r l e d e v e l o p Y A C s ; D o n i s - K e l l e r p u b l i s h f i r s t m a p ( 4 0 3 m a r k e r s ) 3 1 H i s t o r y o f t h e H u m a n G e n o m e P r o j e c t L ị c h s ử c ủ a d ự á n h ệ g e n e n g ư ờ i ( t i ế p ) 1 9 8 7 ( c o n t ) H o o d p r o d u c e s f i r s t a u t o m a t e d s e q u e n c e r ; D u p o n t d e v o l o p s f l u o r e s c e n t d i d e o x y - n u c l e o t i d e s 1 9 8 8 N I H s u p p o r t s t h e H G P ; W a t s o n h e a d s t h e p r o j e c t a n d a l l o c a t e s p a r t o f t h e b u d g e t t o s t u d y s o c i a l a n d e t h i c a l i s s u e s 1 9 8 9 H o o d , O l s o n , B o t s t e i n C a n t o r p r o p o s e u s i n g S T S ’ s t o m a p t h e h u m a n g e n o m e 1 9 9 0 P r o p o s a l t o s e q u e n c e 2 0 M b i n m o d e l o r g a n i s m b y 2 0 0 5 ; L i p m a n , M y e r s p u b l i s h t h e B L A S T a l g o r i t h m 1 9 9 1 V e n t e r a n n o u n c e s s t r a t e g y t o s e q u e n c e E S T s . H e p l a n s t o p a t e n t p a r t i a l c D N A s ; U b e r b a c h e r d e v e l o p s G R A I L , a g e n e f i n d i n g p r o g r a m 1 9 9 2 S i m o n d e v e l o p s B A C s ; U S a n d F r e n c h t e a m s p u b l i s h f i r s t p h y s i c a l m a p s o f c h r o m o s o m e s ; f i r s t g e n e t i c m a p s o f m o u s e a n d h u m a n g e n o m e p u b l i s h e d 1 9 9 3 C o l l i n s i s n a m e d d i r e c t o r o f N C H G R ; r e v i s e p l a n t o c o m p l e t e s e q o f h u m a n g e n o m e b y 2 0 0 5 1 9 9 5 V e n t e r p u b l i s h e s f i r s t s e q u e n c e o f f r e e - l i v i n g o r g a n i s m : H . i n f l u e n z a e ( 1 . 8 M b ) ; B r o w n p u b l i s h e s o n D N A a r r a y s 1 9 9 6 Y e a s t g e n o m e i s s e q u e n c e d ( S . c e r e v i s i a e ) 3 2 H i s t o r y o f t h e H u m a n G e n o m e P r o j e c t L ị c h s ử c ủ a d ự á n h ệ g e n e n g ư ờ i ( t i ế p ) 1 9 9 7 B l a t t n e r , P l u n k e t c o m p l e t e E . c o l i s e q u e n c e ; a c a p i l l a r y s e q u e n c i n g m a c h i n e i s i n t r o d u c e d . 1 9 9 8 S N P p r o j e c t i s i n i t i a t e d ; r i c e g e n o m e p r o j e c t i s s t a r t e d ; V e n t e r c r e a t e s n e w c o m p a n y c a l l e d C e l e r a a n d p r o p o s e s t o s e q u e n c e H G w i t h i n 3 y e a r s ; C . e l e g a n s g e n o m e c o m p l e t e d 1 9 9 9 N I H p r o p o s e s t o s e q u e n c e m o u s e g e n o m e i n 3 y e a r s ; f i r s t s e q u e n c e o f c h r o m o s o m e 2 2 i s a n n o u n c e d 2 0 0 0 C e l e r a a n d o t h e r s p u b l i s h D r o s p h i l a s e q u e n c e ( 1 8 0 M b ) ; h u m a n c h r o m o s o m e 2 1 i s c o m p l e t e l y s e q u e n c e d ; p r o p o s a l t o s e q u e n c e p u f f e r f i s h ; A r a b a d o p s i s s e q u e n c e i s c o m p l e t e d 2 0 0 1 C e l e r a p u b l i s h e s h u m a n s e q u e n c e i n S c i e n c e ; t h e H G P c o n s o r t i u m p u b l i s h e s t h e h u m a n s e q u e n c e i n N a t u r e h t t p : / / w w w . d - t r e n d s . c o m / B i o i n f o r m a t i c s / t i m e l i n e . h t m l 2 0 0 3 C o m p l e t e l y s e q u e n c e d h u m a n g e n o m e . 3 3 W h a t i s b i o i n f o r m a t i c s ? T i n s i n h h ọ c l à g ì ?  B i o : S i n h h ọ c p h â n t ử ( M o l e c u l a r B i o l o g y )  I n f o r m a t i c s : K h o a h ọ c t í n h t o á n  B i o i n f o r m a t i c s : G i ả i q u y ế t c á c b à i t o á n s i n h h ọ c b ằ n g v i ệ c s ử d ụ n g c á c p h ư ơ n g p h á p c ủ a k h o a h ọ c t í n h t o á n . S y n o n y m s : C o m p u t a t i o n a l b i o l o g y , C o m p u t a t i o n a l m o l e c u l a r b i o l o g y , B i o c o m p u t i n g 3 4 T h a y đ ổ i t r o n g s i n h h ọ c P a r a d i g m s h i f t i n b i o l o g y M ộ t k i ể u t h ứ c m ớ i đ a n g x u ấ t h i ệ n l à t ấ t c ả c á c ‘ g e n e s ’ s ẽ s ớ m đ ư ợ c b i ế t h ế t ( t h e o n g h ĩ a c ó t r o n g c á c c ơ s ở d ữ l i ệ u đ i ệ n t ử ) , v à n g h ĩ a l à đ i ể m b ắ t đ ầ u c ủ a m ộ t k h ả o s á t s i n h h ọ c s ẽ l à l ý t h u y ế t . M ỗ i n h à k h o a h ọ c s ẽ k h ở i đ ầ u b ằ n g m ộ t ư ớ c đ o á n l ý t h u y ế t , r ồ i m ớ i c h u y ể n q u a l à m t h í n g h i ệ m đ ể t h e o h o ặ c k i ể m t r a g i ả t h u y ế t . Đ ể d ù n g d ò n g c h ả y t r i t h ứ c t r ê n c á c m ạ n g t o à n c ầ u , c á c n h à s i n h h ọ c k h ô n g n h ữ n g p h ả i b i ế t d ù n g m á y t í n h , m à c ò n p h ả i t h a y đ ổ i c á c h t i ế p c ậ n c ủ a m ì n h đ ố i v ớ i b à i t o á n h i ể u s ự s ố n g . T h e n e w p a r a d i g m , n o w e m e r g i n g , i s t h a t a l l t h e ‘ g e n e s ’ w i l l b e k n o w n ( i n t h e s e n s e o f b e i n g r e s i d e n t i n d a t a b a s e s a v a i l a b l e e l e c t r o n i c a l l y ) , a n d t h a t t h e s t a r t i n g p o i n t o f a b i o l o g i c a l i n v e s t i g a t i o n w i l l b e t h e o r e t i c a l . A n i n d i v i d u a l s c i e n t i s t w i l l b e g i n w i t h a t h e o r e t i c a l c o n j e c t u r e , o n l y t h e n t u r n i n g t o e x p e r i m e n t t o f o l l o w o r t e s t t h a t h y p o t h e s i s . T o u s e [ t h e ] f l o o d o f k n o w l e d g e , w h i c h w i l l p o u r a c r o s s t h e c o m p u t e r n e t w o r k s o f t h e w o r l d , b i o l o g i s t s n o t o n l y m u s t b e c o m e c o m p u t e r l i t e r a t e , b u t a l s o c h a n g e t h e i r a p p r o a c h t o t h e p r o b l e m o f u n d e r s t a n d i n g l i f e . M ộ t k i ể u t h ứ c m ớ i đ a n g x u ấ t h i ệ n l à t ấ t c ả c á c ‘ g e n e s ’ s ẽ s ớ m đ ư ợ c b i ế t h ế t ( t h e o n g h ĩ a c ó t r o n g c á c c ơ s ở d ữ l i ệ u đ i ệ n t ử ) , v à n g h ĩ a l à đ i ể m b ắ t đ ầ u c ủ a m ộ t k h ả o s á t s i n h h ọ c s ẽ l à l ý t h u y ế t . M ỗ i n h à k h o a h ọ c s ẽ k h ở i đ ầ u b ằ n g m ộ t ư ớ c đ o á n l ý t h u y ế t , r ồ i ớ i c h u y ể n q u a l à t h í n g h i ệ đ ể t h e o h o ặ c k i ể m t r a g i ả t h u y ế t . Đ ể d ù n g d ò n g c h ả y t r i t h ứ c t r ê n c á c m ạ n g t o à n c ầ u , c á c n h à s i n h h ọ c k h ô n g n h ữ n g p h ả i b i ế t d ù n g á y t í n h , m à c ò n p h ả i t h a y đ ổ i c á c h t i ế p c ậ n c ủ a ì n h đ ố i v ớ i b à i t o á n h i ể u s ự s ố n g . T h e n e w p a r a d i g m , n o w e m e r g i n g , i s t h a t a l l t h e ‘ g e n e s ’ w i l l b e k n o w n ( i n t h e s e n s e o f b e i n g r e s i d e n t i n d a t a b a s e s a v a i l a b l e e l e c t r o n i c a l l y ) , a n d t h a t t h e s t a r t i n g p o i n t o f a b i o l o g i c a l i n v e s t i g a t i o n w i l l b e t h e o r e t i c a l . A n i n d i v i d u a l s c i e n t i s t w i l l b e g i n w i t h a t h e o r e t i c a l c o n j e c t u r e , o n l y t h e n t u r n i n g t o e x p e r i m e n t t o f o l l o w o r t e s t t h a t h y p o t h e s i s . T o u s e [ t h e ] f l o o d o f k n o w l e d g e , w h i c h w i l l p o u r a c r o s s t h e c o m p u t e r n e t w o r k s o f t h e w o r l d , b i o l o g i s t s n o t o n l y m u s t b e c o m e c o m p u t e r l i t e r a t e , b u t a l s o c h a n g e t h e i r a p p r o a c h t o t h e p r o b l e m o f u n d e r s t a n d i n g l i f e . W a l t e r G i l b e r t . 1 9 9 1 . T o w a r d s a p a r a d i g m s h i f t i n b i o l o g y . N a t u r e , 3 4 9 : 9 9 . W a l t e r G i l b e r t . 1 9 9 1 . T o w a r d s a p a r a d i g m s h i f t i n b i o l o g y . N a t u r e , 3 4 9 : 9 9 . 3 5 B a s e P a i r s i n G e n B a n k 1 0 , 2 6 7 , 5 0 7 , 2 8 2 b a s e s i n 9 , 0 9 2 , 7 6 0 r e c o r d s . 3 6 P u b l i c d a t a b a s e s 3 7 M ở r ộ n g c á c k h á i n i ệ m c ủ a T i n s i n h h ọ c „ G e n e h ọ c ( g e n o m i c s ) … G e n e h ọ c c h ứ c n ă n g … G e n e h ọ c c ấ u t r ú c „ P r o t e i n h ọ c ( P r o t e o m i c s ) : P h â n t í c h p r o t e i n s c ủ a m ộ t s i n h v ậ t ở n h i ề u m ứ c ( l a r g e s c a l e ) „ G e n e d ư ợ c h ọ c ( P h a r m a c o g e n o m i c s ) : P h á t t r i ể n c á c t h u ố c m ớ i n h ằ m đ ế n c á c b ệ n h đ ặ c b i ệ t „ M i c r o a r r a y ( g e n o m e c h i p ) : D N A c h i p , p r o t e i n c h i p X á c đ ị n h v à đ ặ c t r ư n g c h ứ c n ă n g c ủ a g e n e s . N g h i ê n c ứ u t h ể h i ệ n g e n e ở m ọ i m ứ c c ủ a p r o t e i n b ở i đ ồ n g n h ấ t v à đ ặ t t r ư n g p r o t e i n s c ó t r o n g c á c m ẫ u s i n h h ọ c . D ù n g t h ô n g t i n v ề g e n e đ ể d ự đ o á n s ự a n t o à n , đ ộ c t í n h v à / h o ặ c h i ệ u q u ả c ủ a t h u ố c v ớ i n g ư ờ i b ệ n h h o ặ c n h ó m n g ư ờ i b ệ n h . M ộ t c ô n g n g h ệ m ớ i n h ằ m đ ư a t o à n b ộ h ệ g e n e t r ê n m ộ t c h i p s a o c h o c á c n g h i ê n c ứ u v i ê n c ó m ộ t b ứ c t r a n h t ố t h ơ n v ề t ư ơ n g t á c đ ồ n g t h ờ i c ủ a h à n g n g à n g e n e s 3 8 P r o b l e m s i n B i o i n f o r m a t i c s P h â n t í c h c ấ u t r ú c „ S o s á n h c ấ u t r ú c p r o t e i n „ D ự đ o á n c ấ u t r ú c p r o t e i n „ M ô h ì n h h ó a c ấ u t r ú c R N A 0 1 , 0 0 0 2 , 0 0 0 3 , 0 0 0 4 , 0 0 0 4 , 0 0 03 , 0 0 02 , 0 0 01 , 0 0 00 2 . 0 1 . 5 1 . 0 0 . 5 - 0 . 0 2 . 0 1 . 5 1 . 0 0 . 5 - 0 . 0 2 . 0 1 . 5 1 . 0 0 . 5 - 0 . 0 7 6 8 T T . . . . T G T G T G C A T T T A A G G G T G A T A G T G T A T T T G C T C T T T A A G A G C T G 8 1 3 | | | | | | | | | | | | | | | | | | | | | | | | | | | 8 7 T T G A C A G G T A C C C A A C T G T G T G T G C T G A T G T A . T T G C T G G C C A A G G A C T G 1 3 5 . . . . . 8 1 4 A G T G T T T G A G C C T C T G T T T G T G T G T A A T T G A G T G T G C A T G T G T G G G A G T G 8 6 3 | | | | | | | | | | | | | | | | | | | | 1 3 6 A A G G A T C . . . . . . . . . . . . . T C A G T A A T T A A T C A T G C A C C T A T G T G G C G G 1 7 2 . . . . . 8 6 4 A A A T T G T G G A A T G T G T A T G C T C A T A G C A C T G A G T G A A A A T A A A A G A T T G T 9 1 3 | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 1 7 3 A A A . T A T G G G A T A T G C A T G T C G A . . . C A C T G A G T G . . A A G G C A A G A T T A T 2 1 6 P h â n t í c h đ ư ờ n g c h u y ể n h ó a „ Đ ư ờ n g t r a o đ ổ i c h ấ t ( m e t a b o l i c p a t h w a y ) „ M ạ n g đ i ề u t i ế t ( r e g u l a t o r y n e t w o r k s ) P h â n t í c h d ã y „ S ắ p d ã y ( s e q u e n c e a l i g n m e n t ) „ D ự đ o á n c h ứ c n ă n g v à c ấ u t r ú c „ T ì m g e n e ( G e n e f i n d i n g ) P h â n t í c h t h ể h i ệ n „ P h â n t í c h t h ể h i ệ n g e n e „ P h â n n h ó m g e n e 3 9 P a t h w a y a n a l y s i s „ M ỗ i p h ả n ứ n g h ó a h ọ c h o á n c h u y ể n ( i n t e r c o n v e r t s ) c á c t h à n h p h ầ n h ó a h ọ c „ M ộ t e n z y m e l à m ộ t p r o t e i n c ó c h ứ c n ă n g t h ú c đ ẩ y c á c p h ả n ứ n g h ó a h ọ c „ M ộ t đ ư ờ n g c h u y ể n h ó a ( p a t h w a y ) l à m ộ t t ậ p c á c p h ả n ứ n g h ó a h ọ c đ ư ợ c n ố i v ớ i n h a u . 4 0 A n o v e r v i e w o f s e q u e n c e a n a l y s i s N u c l e o t i d e s e q u e n c e f i l e S e a r c h d a t a b a s e s f o r s i m i l a r s e q u e n c e s S e q u e n c e c o m p a r i s o n M u l t i p l e s e q u e n c e a n a l y s i s D e s i g n f u r t h e r e x p e r i m e n t s z R e s t r i c t i o n m a p p i n g z P C R p l a n n i n g T r a n s l a t e i n t o p r o t e i n S e a r c h f o r k n o w n m o t i f s R N A s t r u c t u r e p r e d i c t i o n n o n - c o d i n g c o d i n g P r o t e i n s e q u e n c e a n a l y s i s S e a r c h f o r p r o t e i n c o d i n g r e g i o n s M a n u a l s e q u e n c e e n t r y S e q u e n c e d a t a b a s e b r o w s i n g S e q u e n c i n g p r o j e c t m a n a g e m e n t P r o t e i n s e q u e n c e f i l e S e a r c h d a t a b a s e s f o r s i m i l a r s e q u e n c e s S e q u e n c e c o m p a r i s o n S e a r c h f o r k n o w n m o t i f s P r e d i c t s e c o n d a r y s t r u c t u r e P r e d i c t t e r t i a r y s t r u c t u r e C r e a t e a m u l t i p l e s e q u e n c e a l i g n m e n t E d i t t h e a l i g n m e n t F o r m a t t h e a l i g n m e n t f o r p u b l i c a t i o n M o l e c u l a r p h y l o g e n y P r o t e i n f a m i l y a n a l y s i s N u c l e o t i d e s e q u e n c e a n a l y s i s S e q u e n c e e n t r y 4 1 P r i m a r y p u b l i c d o m a i n b i o i n f o r m a t i c s s e r v e r s P u b l i c D o m a i n B i o i n f o r m a t i c s F a c i l i t i e s E u r o p e a n B i o i n f o r m a t i c s I n s t i t u t e ( E B I ) U n i t e d K i n g d o m N a t i o n a l C e n t e r F o r B i o t e c h n o l o g y I n f o r m a t i o n ( N C B I ) U n i t e d S t a t e s G e n o m e N e t ( K E G G & D D B J ) J a p a n D a t a b a s e s A n a l y s i s T o o l s D a t a b a s e s A n a l y s i s T o o l s D a t a b a s e s A n a l y s i s T o o l s 4 2 A n a l y s i s T o o l s C ô n g c ụ p h â n t í c h E B I l o c á c v e r s i o n s đ ể t ì m c á c c ơ s ở d ữ l i ệ u t r o n g c á c l ĩ n h v ự c c ô n g c ộ n g c h ủ y ế u v à c á c c ô n g c ụ p h â n t í c h n h ư F A S T A , C L U S T A L W , B L A S T , v à c á c c à i đ ặ t c ủ a S m i t h & W a t e r m a n . 4 3 C h a l l e n g e s i n B i o i n f o r m a t i c s „ T i n s i n h h ọ c đ ò i h ỏ i : … T r u y n h ậ p v à o đ ư ợ c n h i ề u n g u ồ n p h â n t á n ( A c c e s s t o m u l t i p l e d i s t r i b u t e d r e s o u r c e s ) … C ầ n t h ô n g t i n đ ư ợ c c ậ p n h ậ t ( N e e d s i n f o r m a t i o n t o b e u p - t o - d a t e ) … D ư t h ừ a d ữ l i ệ u t ố i t h i ể u ( M i n i m a l d a t a r e d u n d a n c y ) … C á c ứ n g d ụ n g ổ n đ ị n h ( R o b u s t a p p l i c a t i o n s ) … C á c ứ n g d ụ n g m ở r ộ n g đ ư ợ c ( E x t e n d a b l e a p p l i c a t i o n s ) „ M o n o l i t h i c A p p . v s . C o m p o n e n t s … C á c p h ầ n m ề m c h u y ể n t ả i đ ư ợ c ( P o r t a b l e s o f t w a r e ) 4 4 „ B ù n g n ổ t h ô n g t i n … C ầ n p h â n t í c h đ ư ợ c n h a n h , t ự đ ộ n g đ ể x ử l ý đ ư ợ c l ư ợ n g t h ô n g t i n l ớ n … C ầ n t í c h h ợ p đ ư ợ c n h i ề u k i ể u t h ô n g t i n k h á c n h a u ( s e q u e n c e s , l i t e r a t u r e , a n n o t a t i o n s , p r o t e i n l e v e l s , R N A l e v e l s e t c ) … C ầ n c á c p h ầ n m ề m “ t h ô n g m i n h h ơ n ” đ ể n h ậ n b i ế t đ ư ợ c c á c q u a n h ệ q u a n t r ọ n g t r o n g c á c t ậ p d ữ l i ệ u r ấ t l ớ n . „ T h i ế u c á c “ n h à t i n s i n h h ọ c ” ( “ b i o i n f o r m a t i c i a n s ” ) … P h ầ n m ề m c ầ n d ễ t r u y n h ậ p , d ễ d ù n g v à d ễ h i ể u h ơ n … N h à s i n h h ọ c c ầ n h ọ c p h ầ n m ề m , t h ấ y h ạ n c h ế c ủ a c h ú n g , v à c á c h g i ả i t h í c h k ế t q u ả c ủ a c h ú n g . C h a l l e n g e s i n B i o i n f o r m a t i c s 4 5 O u t l i n e „ K h á i n i ệ m c ơ b ả n c ủ a s i n h h ọ c „ S i n h t i n h ọ c

Các file đính kèm theo tài liệu này:

  • pdfgiao_trinh_gioi_thieu_ve_tin_sinh_hoc.pdf