Bug #81709 for Helios: WORKER_MAX_TTL parameter not always enforced

Tue Dec 04 17:46:06 2012 LAJANDY [...] cpan.org - Ticket created

Subject:

WORKER_MAX_TTL parameter not always enforced

Client had a runaway process that was not killed after WORKER_MAX_TTL seconds passed. They have seen Helios act appropriately to kill such processes before, but it apparently is not always enforced.

Wed Dec 05 20:17:54 2012 LAJANDY [...] cpan.org - Status changed from 'new' to 'open'

Wed Dec 05 20:17:59 2012 LAJANDY [...] cpan.org - Taken

Wed Dec 05 20:33:15 2012 LAJANDY [...] cpan.org - Correspondence added

On Tue Dec 04 17:46:06 2012, LAJANDY wrote: Show quoted text

> Client had a runaway process that was not killed after WORKER_MAX_TTL > seconds passed. They have seen Helios act appropriately to kill such > processes before, but it apparently is not always enforced.

The WORKER_MAX_TTL parameter is currently only enforced if MAX_WORKERS processes has been reached or HOLD is in effect. This is apparently an oversight by the <ahem> original developer. The cleanest place to enforce WORKER_MAX_TTL in normal operation (at least for now) is just after service registration. That way, helios.pl checks on the running workers often, but not so frequently it ends up spending more time checking for workers to kill than its primary job of actually launching workers. I have a proof-of-concept that works in a forked repo in github...I'll get an official patched release together soon.

Wed Dec 05 20:34:31 2012 LAJANDY [...] cpan.org - Broken in 2.22 added

Wed Dec 05 20:34:31 2012 LAJANDY [...] cpan.org - Broken in 2.23 added

Wed Dec 05 20:34:31 2012 LAJANDY [...] cpan.org - Broken in 2.40 added

Wed Dec 05 20:34:31 2012 LAJANDY [...] cpan.org - Broken in 2.41 added

Tue Dec 11 20:49:37 2012 LAJANDY [...] cpan.org - Correspondence added

Fix committed in GitHub branch: https://github.com/logicalhelion/helios/tree/bug/rt81709

Wed Dec 12 20:03:20 2012 LAJANDY [...] cpan.org - Status changed from 'open' to 'patched'

Wed Dec 12 20:05:15 2012 LAJANDY [...] cpan.org - Correspondence added

Patch in above GitHub branch has been tested and works. We'll put together a new Helios release in a few days incorporating the change.

Wed Dec 12 20:05:16 2012 The RT System itself - Status changed from 'patched' to 'open'

Fri Sep 13 16:51:59 2013 LAJANDY [...] cpan.org - Correspondence added

On Wed Dec 12 20:05:15 2012, LAJANDY wrote: Show quoted text

> Patch in above GitHub branch has been tested and works. We'll put > together a new Helios release in a few days incorporating the change.

Fri Sep 13 16:51:59 2013 LAJANDY [...] cpan.org - Status changed from 'open' to 'patched'

Fri Sep 13 16:51:59 2013 LAJANDY [...] cpan.org - Fixed in 2.601_3610 added

Fri Sep 13 16:51:59 2013 LAJANDY [...] cpan.org - Fixed in 2.601_3670 added

Sat Sep 14 18:47:37 2013 LAJANDY [...] cpan.org - Correspondence added

On Fri Sep 13 16:51:59 2013, LAJANDY wrote: Show quoted text

> On Wed Dec 12 20:05:15 2012, LAJANDY wrote:

> > Patch in above GitHub branch has been tested and works. We'll put > > together a new Helios release in a few days incorporating the change.

>

Sat Sep 14 18:47:37 2013 LAJANDY [...] cpan.org - Fixed in 2.601_3750 added

Mon Sep 16 19:52:27 2013 LAJANDY [...] cpan.org - Correspondence added

On Sat Sep 14 18:47:37 2013, LAJANDY wrote: Show quoted text

> On Fri Sep 13 16:51:59 2013, LAJANDY wrote:

> > On Wed Dec 12 20:05:15 2012, LAJANDY wrote:

> > > Patch in above GitHub branch has been tested and works. We'll put > > > together a new Helios release in a few days incorporating the change.

> >

Mon Sep 16 19:52:28 2013 LAJANDY [...] cpan.org - Status changed from 'patched' to 'resolved'

Mon Sep 16 19:52:28 2013 LAJANDY [...] cpan.org - Fixed in 2.61 added