[chef] Re: Re: CM/Chef API access for monitoring systems?


Chronological Thread 
  • From: AJ Christensen < >
  • To:
  • Subject: [chef] Re: Re: CM/Chef API access for monitoring systems?
  • Date: Wed, 26 Sep 2012 20:37:59 +1200

Hello!

Good to hear Bay Area Chef Users Group is doing well!

Heavy Water has had great success with Sensu, developed at Sonian, now
open source, which has tremendously good open source integration with
Chef/Puppet:

http://github.com/sensu/sensu
http://blog.sonian.com/technology-blog/bid/77977/Sensu-A-Monitoring-Framework

Heavy Water's Echelon project has Sensu integration, albeit a little
dated now; Echelon has some other useful monitoring and metrics
integration: collectd/sensu <-> graphite (AMQP) w/ gdash frontend. We
generally rig Sensu up to Pagerduty, Campfire and IRC. One of the
founders of Heavy Water operations gave a talk regarding Echelon at
ChefConf 2012:

http://www.youtube.com/watch?v=BXxtdE-Paco&hd=1

https://github.com/heavywater/echelon
https://github.com/heavywater/chef-gdash
https://github.com/heavywater/chef-graphite
https://github.com/heavywater/chef-echelon_sensu

Our gdash cookbook features LWRPs that make it pretty easy to
dynamically define a dashes/components based on search responses from
Chef. I know San Francisco DevOps (meetup) recently had a discussion
regarding Sensu with something like 60 attendees!
(http://www.meetup.com/San-Francisco-DevOps)

Cheers,

AJ

On 26 September 2012 20:01, John Martinez 
< >
 wrote:
> A monitoring system that utilizes Ohai data?
>
> Stop it, you're teasing me. :-)
>
> I'm keeping an eye on Assimilation.
>
> On Sep 26, 2012, at 12:55 AM, Brad Knowles 
> < >
>  wrote:
>
>> Folks,
>>
>> At the Bay Area Chef Users Group meeting tonight (see 
>> <http://www.meetup.com/The-Bay-Area-Chef-User-Group/events/82878822/>), I 
>> got the pleasure of listening to Daniel talk about the new "whyrun" mode 
>> and some of the other new features of Chef.  I'm always pleasantly 
>> surprised by the speakers that BAChef manages to bring in.
>>
>>
>> We also had a question from the audience as to why we can't ever get a 
>> good monitoring system that is able to work hand-in-hand with a good CM 
>> system (like Chef), and so we're stuck with things like trying to write or 
>> implement Nagios NRPE modules and the monitoring system ends up being the 
>> heaviest thing we do -- it takes the most work to manage, it generates the 
>> most crap noise, it takes the longest to converge, and is generally very 
>> ... unsatisfactory.
>>
>> Of course, there are other monitoring solutions out there, depending on 
>> how much information you want to monitor about each node, and how you want 
>> to go about gathering and using that information.  But Zenoss doesn't seem 
>> to be measurably better in this particular area, nor does any other 
>> monitoring system that I am personally acquainted with.
>>
>>
>> Now, I happen to know that Alan Robertson has been working on a new 
>> project called the Assimilation Monitoring Project (see 
>> <http://assimmon.org/>), and I believe that the architecture of AssimMon 
>> will scale better than any other monitoring system I know of.  Of course, 
>> it is very much a work-in-progress, and there is still a lot left to do.  
>> But I think Alan is pretty well suited to the task, based on his work on 
>> the Linux-HA project and based on what I've seen of the talk he gave at 
>> LinuxCon 2012 about AssimMon (we're hoping to get the edited video for 
>> that posted very soon).
>>
>> However, it occurs to me that one of the things that a good monitoring 
>> system could make use of would be a relatively simple standardized API to 
>> be able to access things like Ohai discovered data regarding the nodes, as 
>> well as Chef-managed data regarding the nodes.  There's no sense 
>> re-inventing the wheels that Chef has already invented, if you can 
>> relatively easily make use of what is already there.
>>
>>
>> So, now I start to wonder what such a standardized API might look like, 
>> and what kinds of information might be useful for a monitoring system to 
>> be able to access regarding the nodes it should be monitoring?
>>
>> Which leads me to the idea of posting such a question on this list, to see 
>> if anyone else had any ideas or thoughts?
>>
>>
>> Thanks!
>>
>> --
>> Brad Knowles 
>> < >
>> LinkedIn Profile: <http://tinyurl.com/y8kpxu>
>>
>



Archive powered by MHonArc 2.6.16.

§