Classification is hard, can network science help? A classificação é difícil, rede ciência pode ajudar?
September 7th, 2004 | by ian | 7o setembro, 2004 | por Ian |So I was inspired by a article by a friend of mine in thinking about his post: Por isso, foi inspirada por um artigo por um amigo da mina de pensar sobre o seu lugar: Science is easier from the outside A ciência é mais fácil a partir do exterior . Given my background in experimental evolutionary biology I thought maybe I would throw a few comments his way, then my few comments combined to form something which probably oversteps the bounds of what can be considered a comment. Dada a minha experiência em biologia evolutiva experimental pensei talvez eu jogue alguns comentários seu caminho e, em seguida, alguns comentários meus combinados para formar uma coisa que provavelmente exceda os limites do que pode ser considerado um comentário.
Classification in Biology, or phylogenetics, is fraught with issues that we typically do not face when creating our own systems of classification such as organization of content content on a website. Classificação em Biologia, ou filogenia, está cheio de problemas que nós normalmente não enfrentamos quando criar nossos próprios sistemas de classificação, como a organização de conteúdos conteúdo em um site. Just look at the issues Anthropologists have in studying human evolution which, geologically speaking, happened yesterday. Basta olhar para as questões antropólogos têm em estudar evolução humana, que, geologically falando, aconteceu ontem.
When studying “trees of life” there is the necessarily subjective nomination of a phylogenetic root which causes biases in analysis of the rest of the hierarchy that are impossible to avoid (instead we often run many thousands of iterations of analysis on a dataset varying the choice of root that often yields radical differences). Ao estudar "árvores da vida" não existe necessariamente subjectiva a nomeação de uma raiz filogenética que provoca distorções na análise do resto da hierarquia que são impossíveis de evitar (em vez nós muitas vezes correr muitos milhares de iterações de análise de dados em uma variável à escolha de raiz que, muitas vezes, rendimentos diferenças radicais). Think about it. Pense nisso. How would you go about choosing the root of the tree? Como você ir sobre como escolher a raiz da árvore?
Mismatches between genetic, morphological and life history based phylogenies abound: what data will you favour? Desajustes entre genética, morfológica e história baseadas phylogenies vida abundam: quais os dados a favor você? You might think genetics is the most objective form of classification data but this is often problematic: Você poderia pensar genética é a forma mais objectiva dos dados, mas essa classificação é muitas vezes problemática:
- it is likely you have much less genetic information to work with (morphology preserves more easily than genetic information) é provável que você tem muito menos a trabalhar com a informação genética (morfologia preserva mais facilmente que as informações genéticas)
- genes can be transferred between species via mobile elements, especially in the microbial and plant worlds which make up the majority of life on earth genes entre espécies podem ser transferidos através de elementos móveis, em especial, no microbiana e vegetal mundos que compõem a maioria da vida na Terra
- genes can converge to the point where they look like they may have diverged from a common ancestor genes possa convergir para o ponto onde eles se parecem com eles podem ter divergido de um ancestral comum
Convergence is a problem since it can happen at all levels including genetic, morphological and life history (compared traits evolve separately and converge due to selective pressures and do not indicate shared ancestor). A convergência é um problema, uma vez que pode acontecer em todos os níveis, incluindo genética, morfológica e vida história (em comparação traços evoluir separadamente e convergir devido a pressões seletivas e não indicam partilhada antepassado).
This is all further compounded by gaps in the fossil record: Isto tudo é ainda agravado por falhas no registro fóssil:
- Different body structures and environments determine the ease of fossilization so the fossil record is biased. Corpo e ambientes diferentes estruturas determinam a facilidade de fossilização por isso o registro fóssil é tendenciosa.
- Speciation can happen in the blink of a geological eye, so to speak, both in terms of the generation of diversity and the susequent sorting (selection). Especiação pode acontecer no geológico um piscar de olhos, por assim dizer, tanto em termos da diversidade e da geração de susequent triagem (selecção). It is quite a detective story to determine who the suspects are… Trata-se de um detective bastante história para determinar que os suspeitos estão…
Carl von Linné, the father of modern biological taxonomy, didn’t even have the benefit of understanding evolutionary processes let alone genetics when he developped his Systema Naturae. Lineu, o pai da moderna taxonomia biológica, que nem sequer teve o benefício de processos evolutivos e muito menos o entendimento genética quando ele desenvolveu o seu siste Naturae. Instead he thought he was revealing the divine order in God’s creations. Em vez disso ele pensou que era revelador da ordem divina, em criações de Deus. As a result of this starting assumption and very limited data set that didn’t include much in the way of non-morphological information his original constructions, while logical given what he had to work with, often did not reflect the natural-historical order. Como resultado desta partida e pressuposto muito limitado conjunto de dados que não incluía muito com as suas informações não-morfológica original construções, enquanto a lógica dado o que ele tinha de trabalhar com, muitas vezes não reflectem a ordem natural-histórico.
The wild endeavour of science is one of discovery not invention, which we will leave to engineers. O selvagem da ciência é um empreendimento de descoberta não invento, que vamos deixar para engenheiros. Scientists don’t have the luxury of constructing our world (and when they indulge in that luxury they often take us down the wrong path…not that thats a bad thing!). Os cientistas não têm o luxo de construir o nosso mundo (e quando entrar em luxo que eles levam-nos muitas vezes define o caminho errado… que não thats uma coisa má!). It is a process of discovery fraught with accidental success, abject failure, Eureka moments. Trata-se de um processo de descoberta acidental cheio de sucesso, abjecta fracasso, Eureka momentos.
Classification is such a fundamental aspect of science, but it is also a wholly human one. Essa classificação é um aspecto fundamental da ciência, mas é também um homem um todo. A classification system can both be wildly useful and fundamentally flawed. Um sistema de classificação pode ser tanto selvagens útil e fundamentalmente errado. What happens when something needs to go on two branches that are far apart in the classification structure? O que acontece quando alguma coisa tem que ir em dois ramos que estão muito para além da classificação estrutura?
Maybe a tree with a root and branches is the wrong way to look at classification. Talvez uma árvore com uma raiz e ramos é a forma errada de olhar para classificação. Perhaps we need to navigate a network of organization instead to find a happy home for everything, connected to all things related and far apart from that which is not. Talvez precisemos de navegar de uma rede de organização em vez de encontrar um lar feliz por tudo, ligada a todas as coisas afins, e muito para além do que o que não é. I admit that I am inspired here having recently read the book Admito que estou aqui tendo inspirado recentemente ler o livro Six Degrees: The Science of a Connected Age Six Degrees: A Ciência de um Conectado Idade which I believe to be the best account of why studying networks and their behaviours is relevant to all disciplines. que eu considero ser o melhor em conta a razão por que estudar as suas redes e comportamentos é relevante para todas as disciplinas.
The likely problem is that conceptually and possibly even mathematically a network approach to classification might be too difficult for us! O problema é provável que conceitualmente e, possivelmente, até mesmo uma rede matematicamente a classificação abordagem poderia ser muito difícil para nós!














