Classification is hard, can network science help? Le classement est dur, réseau peut la science?

September 7th, 2004 | by ian | 7 septembre 2004 | par ian |

So I was inspired by a article by a friend of mine in thinking about his post: J'ai donc été inspiré par un article d'un de mes amis dans la réflexion sur son poste: Science is easier from the outside La science est plus facile de l'extérieur . Given my background in experimental evolutionary biology I thought maybe I would throw a few comments his way, then my few comments combined to form something which probably oversteps the bounds of what can be considered a comment. Compte tenu de mon expérience dans la biologie de l'évolution expérimentale je pensais que je voudrais peut-être jeter un peu de ses commentaires, puis mes commentaires combinées pour former quelque chose qui dépasse probablement les limites de ce qui peut être considérée comme un commentaire.

Classification in Biology, or phylogenetics, is fraught with issues that we typically do not face when creating our own systems of classification such as organization of content content on a website. Classement en biologie, ou phylogénétique, se heurte à des questions que nous ne permettent pas de faire face lors de la création de nos propres systèmes de classification tels que l'organisation du contenu contenu sur un site Web. Just look at the issues Anthropologists have in studying human evolution which, geologically speaking, happened yesterday. Il suffit de regarder les questions les anthropologues, ont dans l'étude de l'évolution humaine qui, géologiquement parlant, qui s'est passé hier.

When studying “trees of life” there is the necessarily subjective nomination of a phylogenetic root which causes biases in analysis of the rest of the hierarchy that are impossible to avoid (instead we often run many thousands of iterations of analysis on a dataset varying the choice of root that often yields radical differences). En étudiant "arbres de vie" est nécessairement subjectif la nomination d'un phylogénétique racine les causes qui les biais dans l'analyse du reste de la hiérarchie qui sont impossibles à éviter (la place, nous avons souvent plusieurs milliers d'itérations d'analyse de données sur un variant le choix de la racine qui, souvent, les rendements des différences radicales). Think about it. Pensez-y. How would you go about choosing the root of the tree? Comment allez-vous choisir la racine de l'arbre?

Mismatches between genetic, morphological and life history based phylogenies abound: what data will you favour? L'inadéquation entre les ressources génétiques, morphologiques et de la vie fondée sur l'histoire phylogénies abondent: quelles données allez-vous privilégier? You might think genetics is the most objective form of classification data but this is often problematic: On pourrait penser que la génétique est la plus objective forme de classification des données, mais cela est souvent problématique:

  • it is likely you have much less genetic information to work with (morphology preserves more easily than genetic information) il est probable que vous avez beaucoup moins l'information génétique de travailler avec (morphologie conserve plus facilement que l'information génétique)
  • genes can be transferred between species via mobile elements, especially in the microbial and plant worlds which make up the majority of life on earth gènes peuvent être transférés entre les espèces par des éléments mobiles, en particulier dans le microbiennes et végétales mondes qui composent la majorité de la vie sur terre
  • genes can converge to the point where they look like they may have diverged from a common ancestor gènes peuvent converger vers le point où ils ressemblent à mai, ils ont divergé d'un ancêtre commun

Convergence is a problem since it can happen at all levels including genetic, morphological and life history (compared traits evolve separately and converge due to selective pressures and do not indicate shared ancestor). La convergence est un problème car il peut se produire à tous les niveaux, y compris génétiques, morphologiques et la vie (traits évoluer séparément et de convergence en raison de pressions sélectives et n'indiquent pas ancêtre).

This is all further compounded by gaps in the fossil record: Cela est d'autant plus aggravée par les lacunes dans les fossiles:

  • Different body structures and environments determine the ease of fossilization so the fossil record is biased. Différentes structures de corps et des environnements de déterminer la facilité de fossilisation de sorte que le témoin est biaisé.
  • Speciation can happen in the blink of a geological eye, so to speak, both in terms of the generation of diversity and the susequent sorting (selection). Spéciation peut se produire dans le clignotement d'un oeil géologique, pour ainsi dire, à la fois en termes de génération de la diversité et la susequent tri (sélection). It is quite a detective story to determine who the suspects are… Il est tout à fait une histoire de détective pour déterminer qui sont les suspects…

Carl von Linné, the father of modern biological taxonomy, didn’t even have the benefit of understanding evolutionary processes let alone genetics when he developped his Systema Naturae. Carl von Linné, le père biologique de la taxonomie moderne, n'a même pas bénéficier de la compréhension des processus d'évolution génétique et encore moins quand il a développé son Systema Naturae. Instead he thought he was revealing the divine order in God’s creations. Au contraire, il pensait qu'il était révélant l'ordre divin dans les créations de Dieu. As a result of this starting assumption and very limited data set that didn’t include much in the way of non-morphological information his original constructions, while logical given what he had to work with, often did not reflect the natural-historical order. À la suite de cette hypothèse de départ très limitée et ensemble de données qui ne comprend pas beaucoup de non-informations morphologiques sa construction originale, tandis que logique compte tenu de ce qu'il avait à travailler avec, souvent, ne tient pas compte de la nature-historique.

The wild endeavour of science is one of discovery not invention, which we will leave to engineers. L'entreprise sauvages de la science est un pas de la découverte invention, que nous allons laisser aux ingénieurs. Scientists don’t have the luxury of constructing our world (and when they indulge in that luxury they often take us down the wrong path…not that thats a bad thing!). Les scientifiques n'ont pas le luxe de la construction de notre monde (et quand ils s'adonner à ce luxe, ils nous prennent souvent le mauvais chemin… que thats pas une mauvaise chose!). It is a process of discovery fraught with accidental success, abject failure, Eureka moments. Il s'agit d'un processus de découverte accidentelle lourde avec succès, l'échec abject, Eureka moments.

Classification is such a fundamental aspect of science, but it is also a wholly human one. Le classement est par exemple un aspect fondamental de la science, mais il est également tout à un humain. A classification system can both be wildly useful and fundamentally flawed. Un système de classification peuvent être énormément utile et fondamentalement viciée. What happens when something needs to go on two branches that are far apart in the classification structure? Qu'arrive-t-il quand quelque chose doit aller sur les deux branches qui sont très éloignées dans la structure de classification?

Maybe a tree with a root and branches is the wrong way to look at classification. Peut-être un arbre avec une racine et les branches n'est pas la bonne façon de voir à la classification. Perhaps we need to navigate a network of organization instead to find a happy home for everything, connected to all things related and far apart from that which is not. Peut-être nous avons besoin pour naviguer un réseau d'organisation au lieu de trouver une famille heureuse pour tout, relié à toutes les choses liées et éloignées de celle qui ne l'est pas. I admit that I am inspired here having recently read the book Je dois avouer que je suis inspiré ici qui ont récemment lu le livre Six Degrees: The Science of a Connected Age Six Degrees: The Science of Age un Connectés which I believe to be the best account of why studying networks and their behaviours is relevant to all disciplines. qui, je crois, d'être le meilleur compte de la raison pour laquelle l'étude de réseaux et de leurs comportements est pertinente pour toutes les disciplines.

The likely problem is that conceptually and possibly even mathematically a network approach to classification might be too difficult for us! Le problème est probable que conceptuel et peut-être même mathématiquement une approche de réseau de classement pourrait être trop difficile pour nous!

Post a Comment Publier un commentaire