Classification is hard, can network science help? Классификация трудно, может помочь сеть науки?
September 7th, 2004 | by ian | 7 сентября 2004 | Яном |So I was inspired by a article by a friend of mine in thinking about his post: Поэтому мне было инспирировано статью моего друга в осмыслении его должность: Science is easier from the outside Наука легче снаружи . Given my background in experimental evolutionary biology I thought maybe I would throw a few comments his way, then my few comments combined to form something which probably oversteps the bounds of what can be considered a comment. С учетом моего опыта работы в экспериментальной эволюционной биологии я подумал, может быть, я бы бросить несколько замечаний в свой путь, то моя несколько замечаний в сочетании с формой то, что, вероятно, oversteps рамки того, что можно рассматривать комментарий.
Classification in Biology, or phylogenetics, is fraught with issues that we typically do not face when creating our own systems of classification such as organization of content content on a website. Классификация по биологии, или Филогенетика, сопряжено с вопросами о том, что мы, как правило, не сталкиваются при создании наших собственных систем классификации, такие, как организация содержания контента на сайте. Just look at the issues Anthropologists have in studying human evolution which, geologically speaking, happened yesterday. Просто взглянуть на вопросы Anthropologists имею в изучении эволюции человека, который, выступая в геологическом, случилось вчера.
When studying “trees of life” there is the necessarily subjective nomination of a phylogenetic root which causes biases in analysis of the rest of the hierarchy that are impossible to avoid (instead we often run many thousands of iterations of analysis on a dataset varying the choice of root that often yields radical differences). При изучении "деревья жизни" есть всегда субъективной номинации филогенетических корень которая вызывает перекосы в анализе остальной части иерархии, которые невозможно избежать (а мы часто запускать многие тысячи итераций анализ данных различной выбор корня, что часто дает радикальные различия). Think about it. Подумайте об этом. How would you go about choosing the root of the tree? Как бы вы идете по выбору корень дерева?
Mismatches between genetic, morphological and life history based phylogenies abound: what data will you favour? Несоответствия между генетические, морфологические и жизненные истории основаны phylogenies множество: какие данные будут вам пользу? You might think genetics is the most objective form of classification data but this is often problematic: Вы думаете генетика является наиболее объективной формой классификации данных, но это зачастую проблематично:
- it is likely you have much less genetic information to work with (morphology preserves more easily than genetic information) вполне вероятно, у вас гораздо меньше генетической информации для работы с (морфология консервы легче, чем генетическая информация)
- genes can be transferred between species via mobile elements, especially in the microbial and plant worlds which make up the majority of life on earth гены могут передаваться между видами с помощью мобильных элементов, особенно в микробного и растительного миров, которые составляют большинство форм жизни на Земле
- genes can converge to the point where they look like they may have diverged from a common ancestor гены могут сходиться к точке, где они выглядят как они, возможно, отличаются от общего предка
Convergence is a problem since it can happen at all levels including genetic, morphological and life history (compared traits evolve separately and converge due to selective pressures and do not indicate shared ancestor). Конвергенция является проблемой, поскольку она может произойти на всех уровнях, включая генетические, морфологические и жизненные истории (по сравнению признаков развиваться отдельно и сходятся в результате селективного давления и не указывают на общих предков).
This is all further compounded by gaps in the fossil record: Все это усугубляется пробелы в летописи:
- Different body structures and environments determine the ease of fossilization so the fossil record is biased. Различные структуры тела и окружающей среды, определить, легкость fossilization так летописи, является предвзятым.
- Speciation can happen in the blink of a geological eye, so to speak, both in terms of the generation of diversity and the susequent sorting (selection). Видообразование может случиться в мгновение из геологических глаза, если можно так выразиться, как с точки зрения генерации разнообразия и susequent сортировки (отбор). It is quite a detective story to determine who the suspects are… Вполне детективная история определить, которые являются подозреваемыми…
Carl von Linné, the father of modern biological taxonomy, didn’t even have the benefit of understanding evolutionary processes let alone genetics when he developped his Systema Naturae. Карл фон Linné, отец современной биологической систематики, даже не благо понимание эволюционных процессов, не говоря уже о генетике, когда он разработал свою Система живых. Instead he thought he was revealing the divine order in God’s creations. Вместо этого он думал, что было выявление божественного порядка в Божьего творения. As a result of this starting assumption and very limited data set that didn’t include much in the way of non-morphological information his original constructions, while logical given what he had to work with, often did not reflect the natural-historical order. В результате этого, начиная с вступлением и очень ограниченный набор данных, которые не относятся много способов, не-морфологические информации, его первоначальное строительство, в то время как логично с учетом того, что ему пришлось работать с ними зачастую не отражают природно-исторического порядка.
The wild endeavour of science is one of discovery not invention, which we will leave to engineers. Дикие усилия науки является одним из открытий не изобретение, которое мы оставим для инженеров. Scientists don’t have the luxury of constructing our world (and when they indulge in that luxury they often take us down the wrong path…not that thats a bad thing!). Ученые не роскошь построения нашего мира (а когда они себе в роскоши, что они зачастую принимают нас неверный путь… не в том, что thats совсем неплохо!). It is a process of discovery fraught with accidental success, abject failure, Eureka moments. Это процесс открытия чреваты случайного успеха, крайняя недостаточность, Эврика моменты.
Classification is such a fundamental aspect of science, but it is also a wholly human one. Классификации таких фундаментальных аспектов науки, но это также один полностью прав. A classification system can both be wildly useful and fundamentally flawed. Система классификации может быть так дико полезным и существенные недостатки. What happens when something needs to go on two branches that are far apart in the classification structure? Что происходит, когда-то должна идти по двум отраслям, которые являются далеко друг от друга в структуре классификации?
Maybe a tree with a root and branches is the wrong way to look at classification. Может быть, дерево с корня и ветвей неправильный способ взглянуть на классификацию. Perhaps we need to navigate a network of organization instead to find a happy home for everything, connected to all things related and far apart from that which is not. Возможно, нам нужно переходить сети организации, вместо того, чтобы найти дом для счастливы все, подключенных ко всем вещи связаны между собой и далеки друг от той, которая не является. I admit that I am inspired here having recently read the book Я признаю, что я здесь, вдохновили недавно читать книги Six Degrees: The Science of a Connected Age Шесть степеней: Наука об подключения Возраст which I believe to be the best account of why studying networks and their behaviours is relevant to all disciplines. которые я считаю наиболее счет того, почему изучение сетей и их поведение имеет отношение ко всем дисциплинам.
The likely problem is that conceptually and possibly even mathematically a network approach to classification might be too difficult for us! Скорее всего проблема заключается в том, что концептуально и, возможно, даже математически сетевой подход к классификации могут быть слишком трудным для нас!














