Classification is hard, can network science help? 분류가 힘들 네트워크에 과학 수있습니다하십니까?

September 7th, 2004 | by ian | 2004년 9월 7일 | 교통 이안 |

So I was inspired by a article by a friend of mine in thinking about his post: 그래서 난에 의해 영감은 내 친구 중 한 기사를 자신의 게시물에 대한 사고 방식 : Science is easier from the outside 과학은 외부에서 쉽게 . 합니다. Given my background in experimental evolutionary biology I thought maybe I would throw a few comments his way, then my few comments combined to form something which probably oversteps the bounds of what can be considered a comment. 내 배경에 주어진 실험적인 진화 생물학 줄 알았 던지 아마 몇 의견을 자기 방식, 그렇다면 내 몇몇 의견을 결합하여 양식을 oversteps의 범위 내에서 아마 무언가가 무엇을 할 수 주석으로 간주합니다.

Classification in Biology, or phylogenetics, is fraught with issues that we typically do not face when creating our own systems of classification such as organization of content content on a website. 생물 분류에서, 또는 계통 학은 책임과 문제에 대해 우리가 우리 자신의 시스템을 만들 때 일반적으로 얼굴을하지 분류와 같은 콘텐츠를 웹사이트의 콘텐츠를 조직합니다. Just look at the issues Anthropologists have in studying human evolution which, geologically speaking, happened yesterday. 인류학 자의 문제를 그냥 한 번 살펴 인간의 진화를 공부하고있는, 지질학 말하기, 어제 일어난합니다.

When studying “trees of life” there is the necessarily subjective nomination of a phylogenetic root which causes biases in analysis of the rest of the hierarchy that are impossible to avoid (instead we often run many thousands of iterations of analysis on a dataset varying the choice of root that often yields radical differences). 공부하면 "나무의 삶"저기는 반드시 루트 이로 인해 계통의 주관적인 편견에 지명 분석을 계층 구조의 나머지 부분을 피하기는 불가능하다 (대신에 우리는 자주 반복을 실행의 분석에 많은 수천 개의 데이터 세트의 선택 다양 루트가 종종 과격한 수확량의 차이). Think about it. 생각해보세요. How would you go about choosing the root of the tree? 선택에 대해 어떻게 생각 하나의 루트에있는 이동 나무?

Mismatches between genetic, morphological and life history based phylogenies abound: what data will you favour? 유전자 사이에 불일치, 모양과 생명의 역사 기반 phylogenies은 많지 : 어떤 데이터를 좀 주겠어? You might think genetics is the most objective form of classification data but this is often problematic: 이 유전자는 생각할 수도 있겠지만 대부분의 객관적 형태의 분류 데이터를하지만 이것은 종종 문제가 :

  • it is likely you have much less genetic information to work with (morphology preserves more easily than genetic information) 이 높다 작업이 훨씬 적은 유전 정보를 검색을위한 (모양 보존보다 더 쉽게 유전 정보)
  • genes can be transferred between species via mobile elements, especially in the microbial and plant worlds which make up the majority of life on earth 종 사이의 유전자를 통해 모바일 요소를 전송할 수있습니다, 특히 미생물과 식물의 세계 지구의 생명을 어떤 방법으로 보상을 과반수
  • genes can converge to the point where they look like they may have diverged from a common ancestor 요점을 수렴하는 유전자는 어디에서처럼 그들의 공통된 조상이 갈라 졌을지는 몰라도

Convergence is a problem since it can happen at all levels including genetic, morphological and life history (compared traits evolve separately and converge due to selective pressures and do not indicate shared ancestor). 컨버전스 때문에 문제가 발생할 수있습니다 포함한 모든 수준에서 유전, 모양과 생활 기록 (에 비해 발전의 특성으로 인해 별도로 선택 수렴 압력과 공유하지 조상 나타냅니다).

This is all further compounded by gaps in the fossil record: 이것은 모든 간격을 더 복잡하여 화석 기록 :

  • Different body structures and environments determine the ease of fossilization so the fossil record is biased. 서로 다른 신체 구조와 환경을 결정하는 화석 쉬운 편견 때문에 화석 기록이있습니다.
  • Speciation can happen in the blink of a geological eye, so to speak, both in terms of the generation of diversity and the susequent sorting (selection). 씨에서 발생할 수있습니다 깜박임의 지질학적인 눈, 쉽게 말해, 양쪽의 관점에서 susequent 세대의 다양성과 정렬 (선택 영역)를합니다. It is quite a detective story to determine who the suspects are… 그것은 아주 탐정 이야기를 결정 용의자들이 누구를…

Carl von Linné, the father of modern biological taxonomy, didn’t even have the benefit of understanding evolutionary processes let alone genetics when he developped his Systema Naturae. 칼 폰 linné, 현대적인 생물 분류학의 아버지, 안 진화 과정을 이해의 이익도 유전 는커녕 그의 학상 그가 자연을 개발합니다. Instead he thought he was revealing the divine order in God’s creations. 대신에 그는 신의 순서를 생각에 그는 하나님의 피조물을 공개합니다. As a result of this starting assumption and very limited data set that didn’t include much in the way of non-morphological information his original constructions, while logical given what he had to work with, often did not reflect the natural-historical order. 이 상황의 결과로 추측하고 매우 제한된 데이터 세트를 포함시키지 않았다 - 모양 정보를 많이하는 방법이 아닌 그의 원래 건설, 논리 주어진 어떤 있었을 작동하는 동안, 종종 안의 자연 - 역사적 순서를 반영합니다.

The wild endeavour of science is one of discovery not invention, which we will leave to engineers. 과학의 야생 노력 발명 없다는 하나의 발견이 휴가를 우리는 엔지니어합니다. Scientists don’t have the luxury of constructing our world (and when they indulge in that luxury they often take us down the wrong path…not that thats a bad thing!). 럭셔리의 과학자가없는 우리의 세계를 건설 (그리고 그들이 탐닉이 경로를 잘못 고급 그들은 종종 우리 내려줘… 그렇게 그게 나쁜 일이!). It is a process of discovery fraught with accidental success, abject failure, Eureka moments. 책임과 발견의 과정은 일시적인 성공, 비참한 고장, 유레카 순간합니다.

Classification is such a fundamental aspect of science, but it is also a wholly human one. 이러한 근본적인 측면으로 분류되면 과학, 그러나 그것은 또한 인간의 완전 한합니다. A classification system can both be wildly useful and fundamentally flawed. 분류 시스템은 근본적으로 둘 다 격렬하게 유용하고 결함이있습니다. What happens when something needs to go on two branches that are far apart in the classification structure? 무언가 필요한 때 어떤 현상이 발생 할 수있는 두개의 지점에서 멀리 떨어져있는 분류 구조를?

Maybe a tree with a root and branches is the wrong way to look at classification. 아마 루트 및 지점에 나무를보고는 잘못된 방향으로 분류합니다. Perhaps we need to navigate a network of organization instead to find a happy home for everything, connected to all things related and far apart from that which is not. 어쩌면 우리가 조직의 네트워크를 탐색이 필요 행복한 가정을 찾을 대신에, 모든 관련된 모든 것들에 연결이되지 않는, 멀리 떨어져합니다. I admit that I am inspired here having recently read the book 여기에 영감을 인정하는 데 나는 최근에 나는이 책을 읽고 Six Degrees: The Science of a Connected Age 6 번 : 연결된 시대의 과학 which I believe to be the best account of why studying networks and their behaviours is relevant to all disciplines. 어느 믿습니다 최고의 계정에있는 이유는 공부와 관련된 모든 분야의 네트워크와 그들의 행동은합니다.

The likely problem is that conceptually and possibly even mathematically a network approach to classification might be too difficult for us! the 가능성 문제는 네트워크 접근을 수학적 개념과 종류도 아마 너무 어렵게 수도주세요!

Post a Comment 의견 게시

이메일